Riješeno: pretvorite vremensku oznaku u pande razdoblja

U današnjem svijetu, rad s vremenskim serijama podataka ključna je vještina za programera. Jedan od uobičajenih zadataka je pretvaranje vremenske oznake u određeno razdoblje, kao što su tjedni ili mjesečni podaci. Ova je operacija ključna za razne analize, poput proučavanja trendova i obrazaca u podacima. U ovom ćemo članku istražiti kako pretvoriti vremensku oznaku u razdoblje u skupu podataka vremenske serije pomoću moćne Python biblioteke, Pandas. Također ćemo duboko zaroniti u kod, istražiti biblioteke i funkcije uključene u proces i razumjeti njihov značaj u rješavanju ovog problema.

Pandas je knjižnica za analizu i manipulaciju podataka otvorenog koda, koja pruža fleksibilne i visokoučinkovite funkcije za rad s vremenskim serijama podataka. To čini naš zadatak jednostavnim, točnim i učinkovitim.

Rješenje za pretvaranje podataka vremenske oznake u određeno razdoblje, kao što je tjedno ili mjesečno, uključuje korištenje metode ponovnog uzorkovanja knjižnice Pandas. Ponovno uzorkovanje moćan je alat koji se može koristiti na podacima s vremenskom oznakom ili podacima o vremenskim serijama za povećanje ili smanjenje uzorkovanja podatkovnih točaka. U ovom slučaju smanjit ćemo uzorkovanje podatkovnih točaka kako bismo stvorili željena razdoblja.

Sada pogledajmo objašnjenje koda korak po korak:

1. Uvezite potrebne biblioteke:

import pandas as pd
import numpy as np

2. Napravite ogledni podatkovni okvir s indeksom vremenske oznake:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. Ponovno uzorkujte podatke vremenske serije i pretvorite podatke vremenske oznake u razdoblja:

df_period = df.resample('W').sum()

4. Ispišite rezultirajući podatkovni okvir:

print(df_period)

Konačni podatkovni okvir `df_period` sadrži zbroj izvornih podataka agregiranih prema tjednu.

**Razumijevanje biblioteka i korištenih funkcija**

Pandas knjižnica

Pandas je široko korištena Python biblioteka za manipulaciju i analizu podataka. Omogućuje strukture podataka visoke razine kao što su serije i DataFrame, omogućujući programerima brzo i učinkovito izvođenje operacija poput spajanja, preoblikovanja i čišćenja. U našem slučaju, Pandas pomaže u učinkovitom rukovanju podacima vremenske oznake i pruža vrijedne funkcije poput resample() za pretvaranje podataka vremenske oznake u razdoblja.

Funkcija ponovnog uzorkovanja

Korištenje električnih romobila ističe ponovno uzorkovanje() funkcija u Pandas je prikladna metoda za pretvorbu frekvencije i ponovno uzorkovanje podataka vremenske serije. Omogućuje mnoge opcije za agregaciju podataka ili smanjivanje uzorkovanja, uključujući zbroj, srednju vrijednost, medijan, način rada i druge korisnički definirane funkcije. Ovu funkciju koristimo za pretvaranje podataka vremenske oznake u tjedno razdoblje određivanjem učestalosti ponovnog uzorkovanja kao 'W'. Također možete koristiti 'M' za mjesečno, 'Q' za tromjesečno i tako dalje.

Sada kada smo istražili funkcionalnost Pandas i funkciju ponovnog uzorkovanja za pretvaranje vremenske oznake u podatke o razdoblju, možemo jednostavno rukovati vremenski osjetljivim podacima na smisleniji način. Uz pomoć ovih alata, programeri, analitičari podataka i SEO stručnjaci mogu otkriti jedinstvene uvide iz svojih podataka, pomažući im u donošenju boljih odluka i predviđanja.

Povezani postovi:

Ostavite komentar