Išspręsta: konvertuoti laiko žymą į laikotarpio pandas

Šiuolaikiniame pasaulyje darbas su laiko eilučių duomenimis yra esminis kūrėjo įgūdis. Viena iš įprastų užduočių yra konvertuoti laiko žymą į konkretų laikotarpį, pvz., savaitės ar mėnesio duomenis. Ši operacija yra labai svarbi atliekant įvairias analizes, pvz., tiriant duomenų tendencijas ir modelius. Šiame straipsnyje mes išnagrinėsime, kaip konvertuoti laiko žymą į laikotarpį laiko eilutės duomenų rinkinyje naudojant galingą Python biblioteką Pandas. Taip pat giliai pasinersime į kodą, išnagrinėsime procese dalyvaujančias bibliotekas ir funkcijas bei suprasime jų reikšmę sprendžiant šią problemą.

Pandas yra atvirojo kodo duomenų analizės ir manipuliavimo biblioteka, teikianti lanksčias ir našias funkcijas, skirtas dirbti su laiko eilučių duomenimis. Tai daro mūsų užduotį paprastą, tikslią ir efektyvią.

Sprendimas konvertuoti laiko žymos duomenis į konkretų laikotarpį, pvz., kas savaitę arba kas mėnesį, apima Pandas bibliotekos pakartotinio atrankos metodą. Resampling yra galingas įrankis, kurį galima naudoti laiko žymos duomenims arba laiko eilučių duomenims didinti arba sumažinti duomenų taškų atranką. Tokiu atveju sumažinsime duomenų taškų mėginius, kad sukurtume norimus laikotarpius.

Dabar pažvelkime į nuoseklų kodo paaiškinimą:

1. Importuokite reikiamas bibliotekas:

import pandas as pd
import numpy as np

2. Sukurkite pavyzdinį duomenų rėmelį su laiko žymos indeksu:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. Iš naujo paimkite laiko eilučių duomenis ir konvertuokite laiko žymos duomenis į laikotarpius:

df_period = df.resample('W').sum()

4. Išspausdinkite gautą duomenų rėmelį:

print(df_period)

Galutiniame duomenų rėmelyje „df_period“ yra pradinių duomenų, sukauptų pagal savaitę, suma.

**Supratimas apie naudojamas bibliotekas ir funkcijas**

Pandų biblioteka

Pandas yra plačiai naudojama Python biblioteka, skirta duomenų apdorojimui ir analizei. Tai suteikia aukšto lygio duomenų struktūras, pvz., Series ir DataFrame, leidžiančias kūrėjams greitai ir efektyviai atlikti tokias operacijas kaip sujungimas, pertvarkymas ir valymas. Mūsų atveju „Pandas“ padeda efektyviai tvarkyti laiko žymos duomenis ir teikia vertingų funkcijų, pvz., resample(), kad konvertuotų laiko žymos duomenis į taškus.

Resample funkcija

Šios resample () funkcija Pandas yra patogus dažnio konvertavimo ir laiko eilučių duomenų atrankos metodas. Jame pateikiama daug duomenų agregavimo arba sumažinimo parinkčių, įskaitant sumos, vidurkio, medianos, režimo ir kitas vartotojo nustatytas funkcijas. Šią funkciją naudojame laiko žymos duomenims konvertuoti į savaitinį laikotarpį, nurodydami pakartotinio atrankos dažnį kaip „W“. Taip pat galite naudoti „M“ mėnesiui, „Q“ – ketvirčiui ir pan.

Dabar, kai ištyrėme Pandas funkcionalumą ir pakartotinio mėginio funkciją, skirtą laiko žymai konvertuoti į laikotarpio duomenis, galime nesunkiai tvarkyti laikui jautrius duomenis prasmingiau. Naudodami šiuos įrankius kūrėjai, duomenų analitikai ir SEO specialistai iš savo duomenų gali atrakinti unikalių įžvalgų, padedančių priimti geresnius sprendimus ir prognozuoti.

Susijusios naujienos:

Palikite komentarą