Lahendatud: kuidas päevade pandade kuupäeva ja kuupäeva vahele jätta

Mood ja programmeerimine võivad tunduda kahe täiesti erineva maailmana, kuid kui rääkida andmete analüüsist ja trendide prognoosimisest, võivad need ilusti kokku tulla. Selles artiklis uurime moetööstuses levinud andmeanalüüsi probleemi: pandade kuupäeva-aja andmetest konkreetsete päevade väljajätmine. See võib olla eriti kasulik mustrite, trendide ja müügiandmete analüüsimisel. Vaatame läbi koodi samm-sammult selgituse ning arutame erinevaid teeke ja funktsioone, mis aitavad meil eesmärki saavutada.

Pandad ja kuupäevaaeg moes

Pandas on populaarne Pythoni raamatukogu, mida kasutatakse peamiselt andmete analüüsimiseks ja töötlemiseks. Moemaailmas saab seda kasutada suure hulga andmete sõelumiseks, et tuvastada trende, analüüsida klientide eelistusi ja ennustada tulevikumustreid. Pandas toetab kuupäeva ja kellaaja funktsiooni, võimaldades meil kuupäevade ja kellaaegadega vaevata töötada.

Paljudel juhtudel on vaja konkreetsed päevad või päevade vahemikud meie andmekogumist välja jätta. Näiteks võiksime välistada nädalavahetused või pühad, et keskenduda olulistele müügipäevadele, nagu must reede või küberesmaspäev.

Probleemi mõistmine

Oletame, et meil on CSV-vormingus igapäevaseid müügiandmeid sisaldav andmestik ja me tahame teavet analüüsida, jättes välja nädalavahetused. Selle saavutamiseks alustame sellest importides andmestiku pandade abil ja seejärel töötleme andmeid nädalavahetuste eemaldamiseks.

Siin on samm-sammuline protsess.

1. Importige vajalikud teegid.
2. Laadige andmestik.
3. Teisendage kuupäeva veerg kuupäeva ja kellaaja vormingusse (kui see pole juba selles vormingus).
4. Filtreerige andmeraam nädalavahetuste välistamiseks.
5. Analüüsige filtreeritud andmeid.

Märge: Seda meetodit saab rakendada igale andmekogumile, mille kuupäev on salvestatud eraldi veerus.

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

Koodeksi tõlgendamine

Ülaltoodud koodiplokis alustame kahe olulise teegi importimisega: pandas ja BDay (äripäev) saidilt pandas.tseries.offsets. Laadime andmestiku panda funktsiooni abil read_csvja veenduge, et veerg on kuupäeva ja kellaaja vormingus.

. dt.dayofweek atribuut tagastab nädalapäeva täisarvuna (esmaspäev: 0, pühapäev: 6). Nädalavahetuste välja filtreerimiseks säilitame ainult ridu, mille dayofweek väärtus on väiksem kui 5.

Lõpuks analüüsime filtreeritud andmeid, printides paar esimest rida, kasutades pea () funktsiooni.

Lisafunktsioonid ja teegid

Seda meetodit saab veelgi laiendada, et see hõlmaks muid filtreerimiskriteeriume või töötaks erinevate kuupäevavahemikega. Mõned kasulikud teegid ja funktsioonid, mis seda protsessi toetavad, on järgmised:

  • NumPy: Pythonis arvulise arvutuse teek, mida saab kasutada tõhusaks massiiviga manipuleerimiseks ja matemaatilisteks operatsioonideks.
  • Kuupäev Kellaaeg: Pythoni standardteegi moodul, mis aitab meil hõlpsalt kuupäevade ja kellaaegadega töötada.
  • kuupäevavahemik: Pandade funktsioon, mis võimaldab meil luua kuupäevavahemikku vastavalt erinevatele sagedusseadetele, nagu tööpäevad, nädalad või kuud.

Kasutades neid tööriistu ja tehnikaid koos pandade ja kuupäeva-aja manipuleerimisega, saate luua tugevaid andmeanalüüsi töövooge, mis vastavad moetööstuse spetsiifilistele vajadustele, nagu trendide, klientide eelistuste ja müügitulemuste tuvastamine.

Seonduvad postitused:

Jäta kommentaar