Vyriešené: previesť časovú pečiatku na dobové pandy

V dnešnom svete je práca s údajmi časových radov nevyhnutnou zručnosťou vývojára. Jednou z bežných úloh je previesť časovú pečiatku na konkrétne obdobie, napríklad týždenné alebo mesačné údaje. Táto operácia je kľúčová pre rôzne analýzy, ako je napríklad štúdium trendov a vzorcov v údajoch. V tomto článku preskúmame, ako previesť časovú pečiatku na obdobie v súbore údajov časovej série pomocou výkonnej knižnice Python, Pandas. Tiež sa hlboko ponoríme do kódu, preskúmame knižnice a funkcie zapojené do procesu a pochopíme ich význam pri riešení tohto problému.

Pandas je open source knižnica na analýzu a manipuláciu s údajmi, ktorá poskytuje flexibilné a vysoko výkonné funkcie na prácu s údajmi z časových radov. Vďaka tomu je naša úloha jednoduchá, presná a efektívna.

Riešenie na konverziu údajov časovej pečiatky na konkrétne obdobie, napríklad týždenné alebo mesačné, zahŕňa použitie metódy prevzorkovania knižnice Pandas. Prevzorkovanie je výkonný nástroj, ktorý možno použiť na údaje časových pečiatok alebo časových radov na prevzorkovanie dátových bodov nahor alebo nadol. V tomto prípade prevzorkujeme dátové body nižšie, aby sme vytvorili požadované obdobia.

Teraz sa pozrime na podrobné vysvetlenie kódu:

1. Importujte potrebné knižnice:

import pandas as pd
import numpy as np

2. Vytvorte vzorový dátový rámec s indexom časovej pečiatky:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. Prevzorkujte údaje časových radov a konvertujte údaje časových pečiatok na obdobia:

df_period = df.resample('W').sum()

4. Vytlačte výsledný dátový rámec:

print(df_period)

Konečný údajový rámec df_period obsahuje súčet pôvodných údajov agregovaných podľa týždňa.

**Pochopenie knižníc a použitých funkcií**

Pandas Library

Pandas je široko používaná knižnica Pythonu na manipuláciu a analýzu údajov. Poskytuje dátové štruktúry na vysokej úrovni ako Series a DataFrame, čo umožňuje vývojárom vykonávať operácie, ako je zlučovanie, pretváranie a čistenie rýchlo a efektívne. V našom prípade Pandas pomáha efektívne narábať s údajmi časových pečiatok a poskytuje cenné funkcie, ako je resample() na konverziu údajov časových pečiatok na obdobia.

Funkcia prevzorkovania

resample() funkcia v Pandas je pohodlnou metódou na konverziu frekvencie a prevzorkovanie údajov časových radov. Poskytuje veľa možností pre agregáciu údajov alebo prevzorkovanie nadol, vrátane súčtu, priemeru, mediánu, režimu a ďalších funkcií definovaných používateľom. Túto funkciu používame na konverziu údajov časovej pečiatky na týždenné obdobie zadaním frekvencie prevzorkovania ako „W“. Môžete tiež použiť „M“ pre mesačné, „Q“ pre štvrťročné atď.

Teraz, keď sme preskúmali funkčnosť Pandas a funkciu prevzorkovania na konverziu časovej pečiatky na údaje obdobia, môžeme ľahko spracovávať časovo citlivé údaje zmysluplnejším spôsobom. Pomocou týchto nástrojov môžu vývojári, dátoví analytici a SEO špecialisti odomknúť jedinečné poznatky zo svojich údajov, čo im pomôže robiť lepšie rozhodnutia a predpovede.

Súvisiace príspevky:

Pridať komentár