Fashion ak pwogramasyon ka sanble tankou de mond konplètman diferan, men lè li rive analiz done ak previzyon tandans, yo ka trè byen reyini ansanm. Nan atik sa a, nou pral eksplore yon pwoblèm komen pou analiz done nan endistri alamòd la: omisyon jou espesifik nan done panda datetime. Sa a ka itil patikilyèman lè w ap analize modèl, tandans, ak done lavant yo. Nou pral ale nan yon eksplikasyon etap pa etap nan kòd la, epi diskite sou divès bibliyotèk ak fonksyon ki pral ede nou reyalize objektif nou an.
contents
Panda ak Datetime nan mòd
Pandas se yon bibliyotèk popilè Python ki itilize prensipalman pou analiz done ak manipilasyon. Nan mond lan nan alamòd, li ka itilize pou analize gwo kantite done yo idantifye tandans, analize preferans kliyan yo, ak predi modèl nan lavni. Pandas sipòte fonctionnalités datetime, ki pèmèt nou travay ak dat ak lè san efò.
Nan anpil ka, li nesesè pou omisyon jou espesifik oswa seri de jou nan seri done nou an. Pou egzanp, nou ta ka vle eskli wikenn oswa jou ferye yo konsantre sou jou lavant enpòtan, tankou Black Friday oswa Cyber Monday.
Konprann Pwoblèm nan
Ann di nou gen yon seri done ki gen done lavant chak jou nan fòma CSV, epi nou vle analize enfòmasyon an pandan y ap ekskli wikenn. Pou reyalize sa, nou pral kòmanse pa enpòte dataset la lè l sèvi avèk panda, ak Lè sa a, nou pral manipile done yo retire wikenn.
Men pwosesis etap pa etap la:
1. Enpòte bibliyotèk ki nesesè yo.
2. Chaje dataset la.
3. Konvèti kolòn dat la nan fòma datetime (si se pa deja nan fòma sa a).
4. Filtre dataframe a pou eskli wikenn.
5. Analize done filtre yo.
Remak: Metòd sa a ka aplike nan nenpòt seri done kote dat la estoke nan yon kolòn separe.
# Step 1: Import the necessary libraries import pandas as pd from pandas.tseries.offsets import BDay # Step 2: Load the dataset data = pd.read_csv('sales_data.csv') # Step 3: Convert the date column to datetime format data['date'] = pd.to_datetime(data['date']) # Step 4: Filter the dataframe to exclude weekends filtered_data = data[data['date'].dt.dayofweek < 5] # Step 5: Analyze the filtered data print(filtered_data.head())
Entèprete Kòd la
Nan blòk kòd ki anwo a, nou kòmanse enpòte de bibliyotèk esansyèl: panda ak BDay (jou ouvrab) nan pandas.tseries.offsets. Nou chaje dataset la lè l sèvi avèk fonksyon panda li_csv, epi asire kolòn dat la nan fòma datetime.
Jounal dt.dayofweek atribi retounen jou nan semèn nan kòm yon nonb antye relatif (Lendi: 0, Dimanch: 6). Pou filtre wikenn, nou sèlman kenbe ranje ki gen yon valè jou nan semèn ki mwens pase 5.
Finalman, nou analize done yo filtre pa enprime premye ranje yo lè l sèvi avèk la tèt () fonksyon.
Fonksyon adisyonèl ak bibliyotèk
Metòd sa a ka pwolonje plis pou enkli lòt kritè filtraj oswa pou travay ak seri dat diferan. Gen kèk bibliyotèk ak fonksyon itil ki ka sipòte pwosesis sa a enkli:
- numPy: Yon bibliyotèk pou enfòmatik nimerik nan Python, ki ka itilize pou manipilasyon etalaj efikas ak operasyon matematik.
- DateTime: Yon modil nan bibliyotèk estanda Python ki ede nou travay ak dat ak lè fasil.
- dat_ranje: Yon fonksyon nan panda ki pèmèt nou kreye yon seri dat dapre diferan paramèt frekans, tankou jou ouvrab, semèn oswa mwa.
Lè w pwofite zouti ak teknik sa yo ansanm ak manipilasyon panda ak dat, ou ka kreye workflows analiz done solid ki satisfè bezwen espesifik endistri alamòd la, tankou idantifye tandans, preferans kliyan, ak pèfòmans lavant yo.