Riješeno: kako izostaviti dane, pande, datum i vrijeme

Moda i programiranje mogu se činiti kao dva potpuno različita svijeta, ali kada je riječ o analizi podataka i predviđanju trendova, mogu se lijepo spojiti. U ovom ćemo članku istražiti čest problem analize podataka u modnoj industriji: izostavljanje određenih dana iz podataka datuma i vremena pande. To može biti osobito korisno pri analizi obrazaca, trendova i podataka o prodaji. Proći ćemo kroz objašnjenje koda korak po korak i razgovarati o raznim bibliotekama i funkcijama koje će nam pomoći da postignemo naš cilj.

Pande i Datetime u modi

Pandas je popularna Python biblioteka koja se prvenstveno koristi za analizu podataka i manipulaciju. U svijetu mode može se upotrijebiti za probiranje golemih količina podataka za prepoznavanje trendova, analizu preferencija kupaca i predviđanje budućih obrazaca. Pandas podržava funkciju datuma i vremena, što nam omogućuje rad s datumima i vremenima bez napora.

U mnogim je slučajevima potrebno izostaviti određene dane ili raspone dana iz našeg skupa podataka. Na primjer, možda bismo željeli isključiti vikende ili praznike kako bismo se usredotočili na važne dane rasprodaje, poput Crnog petka ili Cyber ​​ponedjeljka.

Razumijevanje problema

Recimo da imamo skup podataka koji sadrži dnevne podatke o prodaji u CSV formatu i želimo analizirati informacije isključujući vikende. Da bismo to postigli, počet ćemo od uvoz skupa podataka pomoću pandi, a zatim ćemo manipulirati podacima kako bismo uklonili vikende.

Evo korak po korak postupka:

1. Uvezite potrebne biblioteke.
2. Učitajte skup podataka.
3. Pretvorite stupac datuma u format datuma i vremena (ako već nije u tom formatu).
4. Filtrirajte podatkovni okvir da biste isključili vikende.
5. Analizirajte filtrirane podatke.

Bilješka: Ova se metoda može primijeniti na bilo koji skup podataka gdje je datum pohranjen u zasebnom stupcu.

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

Tumačenje Kodeksa

U gornjem bloku koda započinjemo s uvozom dviju bitnih biblioteka: pandas i BDay (radni dan) iz pandas.tseries.offsets. Skup podataka učitavamo pomoću funkcije pandas read_csvi provjerite je li stupac datuma u formatu datuma i vremena.

Korištenje električnih romobila ističe dt.dan u tjednu atribut vraća dan u tjednu kao cijeli broj (ponedjeljak: 0, nedjelja: 6). Kako bismo filtrirali vikende, zadržavamo samo retke s vrijednošću dana u tjednu manjom od 5.

Na kraju analiziramo filtrirane podatke ispisivanjem prvih nekoliko redaka pomoću glava() funkcija.

Dodatne funkcije i biblioteke

Ova se metoda može dodatno proširiti kako bi uključila druge kriterije filtriranja ili radila s različitim rasponima datuma. Neke korisne biblioteke i funkcije koje mogu podržati ovaj proces uključuju:

  • NumPy: Knjižnica za numeričko računanje u Pythonu, koja se može koristiti za učinkovitu manipulaciju nizovima i matematičke operacije.
  • Datum vrijeme: Modul u Pythonovoj standardnoj biblioteci koji nam pomaže da jednostavno radimo s datumima i vremenima.
  • Raspon datuma: Funkcija unutar Panda koja nam omogućuje stvaranje niza datuma prema različitim postavkama učestalosti, kao što su radni dani, tjedni ili mjeseci.

Iskorištavanjem ovih alata i tehnika u kombinaciji s pandama i manipulacijom datuma i vremena, možete stvoriti robusne tijekove rada analize podataka koji zadovoljavaju specifične potrebe modne industrije, kao što su prepoznavanje trendova, preferencija kupaca i uspješnost prodaje.

Povezani postovi:

Ostavite komentar