Riješeno: kako izostaviti dane pandas datetime

Moda i programiranje mogu izgledati kao dva potpuno različita svijeta, ali kada je riječ o analizi podataka i predviđanju trendova, oni se mogu lijepo spojiti. U ovom članku ćemo istražiti uobičajeni problem za analizu podataka u modnoj industriji: izostavljanje određenih dana iz podataka o datumu i vremenu panda. Ovo može biti posebno korisno kada analizirate obrasce, trendove i podatke o prodaji. Proći ćemo kroz objašnjenje koda korak po korak i razgovarati o raznim bibliotekama i funkcijama koje će nam pomoći da postignemo naš cilj.

Pande i datum u modi

Pandas je popularna Python biblioteka koja se prvenstveno koristi za analizu podataka i manipulaciju. U svijetu mode, može se koristiti za pregledavanje ogromnih količina podataka kako bi se identificirali trendovi, analizirali preferencije kupaca i predvidjeli budući obrasci. Pandas podržava funkciju datuma i vremena, što nam omogućava da bez napora radimo s datumima i vremenom.

U mnogim slučajevima, potrebno je izostaviti određene dane ili raspon dana iz našeg skupa podataka. Na primjer, možda bismo željeli isključiti vikende ili praznike kako bismo se fokusirali na važne dane rasprodaje, kao što su Crni petak ili Cyber ​​ponedjeljak.

Razumijevanje problema

Recimo da imamo skup podataka koji sadrži dnevne podatke o prodaji u CSV formatu i želimo analizirati informacije bez vikenda. Da bismo to postigli, počećemo od uvoz skupa podataka pomoću panda, a zatim ćemo manipulirati podacima da uklonimo vikende.

Evo korak po korak procesa:

1. Uvezite potrebne biblioteke.
2. Učitajte skup podataka.
3. Pretvorite stupac datuma u format datuma i vremena (ako već nije u tom formatu).
4. Filtrirajte okvir podataka da isključite vikende.
5. Analizirajte filtrirane podatke.

Bilješka: Ova metoda se može primijeniti na bilo koji skup podataka gdje je datum pohranjen u zasebnoj koloni.

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

Tumačenje Kodeksa

U bloku koda iznad, počinjemo uvozom dvije osnovne biblioteke: pandas i BDay (radni dan) iz pandas.tseries.offsets. Učitavamo skup podataka pomoću funkcije pandas read_csv, i osigurajte da je stupac datuma u formatu datuma i vremena.

The dt.dayofweek atribut vraća dan u sedmici kao cijeli broj (ponedeljak: 0, nedjelja: 6). Da bismo filtrirali vikende, čuvamo samo redove čija je vrijednost dana u sedmici manja od 5.

Konačno, analiziramo filtrirane podatke ispisom prvih nekoliko redova koristeći glava () funkcija.

Dodatne funkcije i biblioteke

Ova metoda se može dodatno proširiti kako bi uključila druge kriterije filtriranja ili radila s različitim rasponima datuma. Neke korisne biblioteke i funkcije koje mogu podržati ovaj proces uključuju:

  • numPy: Biblioteka za numeričko računanje u Python-u, koja se može koristiti za efikasnu manipulaciju nizom i matematičke operacije.
  • Datum i vrijeme: Modul u Pythonovoj standardnoj biblioteci koji nam pomaže da lako radimo s datumima i vremenom.
  • date_range: Funkcija unutar pandas koja nam omogućava da kreiramo raspon datuma prema različitim postavkama učestalosti, kao što su radni dani, sedmice ili mjeseci.

Koristeći ove alate i tehnike u kombinaciji s pandama i manipulacijom datumom i vremenom, možete kreirati robusne radne tokove analize podataka koji zadovoljavaju specifične potrebe modne industrije, kao što su prepoznavanje trendova, preferencija kupaca i prodajnih performansi.

Slični postovi:

Ostavite komentar