A mai világban az idősoros adatokkal való munka elengedhetetlen készség egy fejlesztő számára. Az egyik gyakori feladat az időbélyeg átalakítása egy adott időszakra, például heti vagy havi adatokra. Ez a művelet kulcsfontosságú különféle elemzésekhez, például az adatok trendjeinek és mintáinak tanulmányozásához. Ebben a cikkben azt fogjuk megvizsgálni, hogyan konvertálhat időbélyeget periódussá egy idősoros adatkészletben a hatékony Python-könyvtár, a Pandas segítségével. Ezenkívül mélyrehatóan belemerülünk a kódba, feltárjuk a folyamatban részt vevő könyvtárakat és funkciókat, és megértjük azok jelentőségét a probléma megoldásában.
A Pandas egy nyílt forráskódú adatelemző és -manipulációs könyvtár, amely rugalmas és nagy teljesítményű funkciókat biztosít az idősoros adatok kezeléséhez. Leegyszerűsíti, pontos és hatékony a feladatunk.
Az időbélyegadatok adott időszakra – például heti vagy havi – konvertálására szolgáló megoldás magában foglalja a Pandas könyvtár újramintavételezési módszerét. Az újramintavételezés egy hatékony eszköz, amely időbélyegadatokon vagy idősoros adatokon használható az adatpontok fel- vagy lemintázására. Ebben az esetben lemintázzuk az adatpontokat a kívánt periódusok létrehozásához.
Most pedig nézzük meg a kód lépésről lépésre történő magyarázatát:
1. Importálja a szükséges könyvtárakat:
import pandas as pd import numpy as np
2. Hozzon létre egy minta adatkeretet időbélyeg-indexszel:
date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D') df = pd.DataFrame(date_rng, columns=['date']) df['data'] = np.random.randint(0,100,size=(len(date_rng))) df.set_index('date', inplace=True)
3. Vegye újra az idősor adatait, és alakítsa át az időbélyegadatokat időszakokká:
df_period = df.resample('W').sum()
4. Nyomtassa ki a kapott adatkeretet:
print(df_period)
A végső „df_period” adatkeret az eredeti adatok hétre összesített összegét tartalmazza.
**A használt könyvtárak és függvények megértése**
Pandas Könyvtár
A Pandas egy széles körben használt Python-könyvtár adatkezelésre és -elemzésre. Magas szintű adatstruktúrákat biztosít, mint például a Series és a DataFrame, lehetővé téve a fejlesztők számára, hogy gyorsan és hatékonyan hajtsanak végre olyan műveleteket, mint az összevonás, átformálás és tisztítás. Esetünkben a Pandas segít az időbélyegadatok hatékony kezelésében, és olyan értékes funkciókat biztosít, mint a resample() az időbélyegadatok időszakokká konvertálásához.
Resample funkció
A resample() A Pandas funkciója kényelmes módszer az idősoros adatok frekvenciakonverziójára és újramintavételezésére. Számos lehetőséget kínál az adatok összesítésére vagy lemintázására, beleértve az összeget, az átlagot, a mediánt, a módot és más, felhasználó által definiált függvényeket. Ezzel a funkcióval időbélyegző adatainkat heti periódussá alakítjuk át úgy, hogy az újramintavételezési gyakoriságot „W”-re adjuk. Használhatja az „M”-t a havi, a „Q”-t a negyedéves és így tovább.
Most, hogy megvizsgáltuk a Pandák funkcionalitását és az időbélyeg időszaki adatokká konvertálására szolgáló újramintavételi funkciót, az időérzékeny adatokat könnyen ésszerűbben kezelhetjük. Ezen eszközök segítségével a fejlesztők, adatelemzők és SEO-szakértők egyedi betekintést nyerhetnek adataikból, így jobb döntéseket és előrejelzéseket hozhatnak.