La moda i la programació poden semblar dos mons completament diferents, però quan es tracta d'anàlisi de dades i previsió de tendències, poden unir-se de manera meravellosa. En aquest article, explorarem un problema comú per a l'anàlisi de dades a la indústria de la moda: l'omissió de dies específics de les dades de datetime dels pandas. Això pot ser especialment útil a l'hora d'analitzar patrons, tendències i dades de vendes. Passarem per una explicació pas a pas del codi i parlarem de diverses biblioteques i funcions que ens ajudaran a assolir el nostre objectiu.
Pandes i Datetime a la moda
Pandas és una popular biblioteca de Python que s'utilitza principalment per a l'anàlisi i la manipulació de dades. Al món de la moda, es pot utilitzar per filtrar grans quantitats de dades per identificar tendències, analitzar les preferències dels clients i predir patrons futurs. Pandas admet la funcionalitat de data i hora, la qual cosa ens permet treballar amb dates i hores sense esforç.
En molts casos, és necessari ometre dies o intervals de dies específics del nostre conjunt de dades. Per exemple, és possible que vulguem excloure els caps de setmana o festius per centrar-nos en els dies de rebaixes importants, com ara el Black Friday o el Cyber Monday.
Comprensió del problema
Suposem que tenim un conjunt de dades que conté dades de vendes diàries en format CSV i volem analitzar la informació excloent els caps de setmana. Per aconseguir-ho, començarem per important el conjunt de dades amb pandas i, a continuació, manipularem les dades per eliminar els caps de setmana.
Aquí teniu el procés pas a pas:
1. Importeu les biblioteques necessàries.
2. Carregueu el conjunt de dades.
3. Converteix la columna de data al format de data i hora (si encara no està en aquest format).
4. Filtreu el marc de dades per excloure els caps de setmana.
5. Analitza les dades filtrades.
Nota: Aquest mètode es pot aplicar a qualsevol conjunt de dades on la data s'emmagatzemi en una columna separada.
# Step 1: Import the necessary libraries import pandas as pd from pandas.tseries.offsets import BDay # Step 2: Load the dataset data = pd.read_csv('sales_data.csv') # Step 3: Convert the date column to datetime format data['date'] = pd.to_datetime(data['date']) # Step 4: Filter the dataframe to exclude weekends filtered_data = data[data['date'].dt.dayofweek < 5] # Step 5: Analyze the filtered data print(filtered_data.head())
Interpretació del Codi
Al bloc de codi anterior, comencem per importar dues biblioteques essencials: pandas i BDay (dia laborable) des de pandas.tseries.offsets. Carreguem el conjunt de dades mitjançant la funció pandas llegir_csv, i assegureu-vos que la columna de data estigui en format de data i hora.
El dt.dia de la setmana L'atribut retorna el dia de la setmana com un nombre enter (dilluns: 0, diumenge: 6). Per filtrar els caps de setmana, només conservem les files amb un valor de dia de la setmana inferior a 5.
Finalment, analitzem les dades filtrades imprimint les primeres files amb el cap () funció.
Funcions addicionals i biblioteques
Aquest mètode es pot ampliar encara més per incloure altres criteris de filtratge o per treballar amb diferents intervals de dates. Algunes biblioteques i funcions útils que poden donar suport a aquest procés inclouen:
- NumPy: Una biblioteca per a la computació numèrica en Python, que es pot utilitzar per a una manipulació eficient de matrius i operacions matemàtiques.
- Data i hora: Un mòdul de la biblioteca estàndard de Python que ens ajuda a treballar fàcilment amb dates i hores.
- interval_dates: Una funció dins de pandas que ens permet crear un rang de dates segons diferents paràmetres de freqüència, com ara dies laborables, setmanes o mesos.
Aprofitant aquestes eines i tècniques juntament amb els pandes i la manipulació de dates i hora, podeu crear fluxos de treball d'anàlisi de dades sòlids que s'adaptin a les necessitats específiques de la indústria de la moda, com ara identificar tendències, preferències dels clients i rendiment de vendes.