Riješeno: pretvoriti vremensku oznaku u period panda

U današnjem svijetu, rad sa podacima vremenskih serija je neophodna vještina za programera. Jedan od uobičajenih zadataka je pretvaranje vremenske oznake u određeni period, kao što su sedmični ili mjesečni podaci. Ova operacija je ključna za različite analize, poput proučavanja trendova i obrazaca u podacima. U ovom članku ćemo istražiti kako pretvoriti vremensku oznaku u period u skupu podataka vremenske serije koristeći moćnu Python biblioteku, Pandas. Također ćemo duboko zaroniti u kod, istražiti biblioteke i funkcije uključene u proces i razumjeti njihov značaj u rješavanju ovog problema.

Pandas je biblioteka otvorenog koda za analizu i manipulaciju podataka, koja pruža fleksibilne i visokoučinkovite funkcije za rad s podacima vremenskih serija. To čini naš zadatak jednostavnim, preciznim i efikasnim.

Rješenje za pretvaranje podataka vremenske oznake u određeni period, kao što je sedmični ili mjesečni, uključuje korištenje metode ponovnog uzorkovanja Pandas biblioteke. Ponovno uzorkovanje je moćan alat koji se može koristiti na podacima vremenske oznake ili vremenskim serijama za povećanje ili smanjenje uzorkovanja tačaka podataka. U ovom slučaju ćemo smanjiti uzorkovanje tačaka podataka kako bismo kreirali željene periode.

Sada, pogledajmo objašnjenje koda korak po korak:

1. Uvezite potrebne biblioteke:

import pandas as pd
import numpy as np

2. Kreirajte uzorak okvira podataka s indeksom vremenske oznake:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. Ponovno uzorkovanje podataka vremenske serije i konvertovanje podataka vremenske oznake u periode:

df_period = df.resample('W').sum()

4. Odštampajte rezultirajući okvir podataka:

print(df_period)

Konačni okvir podataka `df_period` sadrži zbir originalnih podataka agregiranih po sedmici.

**Razumijevanje biblioteka i korištenih funkcija**

Pandas Library

Pandas je široko korišćena Python biblioteka za manipulaciju i analizu podataka. Pruža strukture podataka visokog nivoa kao što su Series i DataFrame, omogućavajući programerima da brzo i efikasno izvode operacije kao što su spajanje, preoblikovanje i čišćenje. U našem slučaju, Pandas pomaže efikasno rukovanje podacima vremenske oznake i pruža vrijedne funkcije kao što je resample() za pretvaranje podataka vremenske oznake u tačke.

Resample Funkcija

The resample() funkcija u Pandasu je pogodna metoda za konverziju frekvencije i ponovno uzorkovanje podataka vremenskih serija. Pruža mnoge opcije za agregaciju podataka ili smanjenje uzorkovanja, uključujući sumu, srednju vrijednost, medijan, način rada i druge korisnički definirane funkcije. Koristimo ovu funkciju da konvertujemo naše podatke vremenske oznake u sedmični period specificirajući učestalost ponovnog uzorkovanja kao 'W'. Također možete koristiti 'M' za mjesečno, 'Q' za tromjesečno itd.

Sada kada smo istražili funkcionalnost Pandas-a i funkciju resample za pretvaranje vremenske oznake u podatke perioda, lako možemo rukovati vremenski osjetljivim podacima na smisleniji način. Uz pomoć ovih alata, programeri, analitičari podataka i SEO stručnjaci mogu otključati jedinstvene uvide iz svojih podataka, pomažući im da donesu bolje odluke i predviđanja.

Slični postovi:

Ostavite komentar