Solved: i-convert ang timestamp sa period pandas

Sa mundo ngayon, ang pagtatrabaho sa data ng time-series ay isang mahalagang kasanayan para sa isang developer. Ang isa sa mga karaniwang gawain ay ang pag-convert ng timestamp sa isang partikular na panahon, gaya ng lingguhan o buwanang data. Napakahalaga ng operasyong ito para sa iba't ibang pagsusuri, tulad ng pag-aaral ng mga trend at pattern sa data. Sa artikulong ito, tuklasin natin kung paano i-convert ang timestamp sa tuldok sa isang dataset ng serye ng oras gamit ang malakas na library ng Python, ang Pandas. Susuriin din natin ang code, tuklasin ang mga aklatan at function na kasangkot sa proseso, at mauunawaan ang kanilang kahalagahan sa paglutas ng problemang ito.

Ang Pandas ay isang open-source na data analysis at manipulation library, na nagbibigay ng flexible at mataas na pagganap na mga function upang gumana sa data ng time-series. Ginagawa nitong simple, tumpak, at mahusay ang ating gawain.

Ang solusyon sa pag-convert ng data ng timestamp sa isang partikular na panahon, gaya ng lingguhan o buwanan, ay kinabibilangan ng paggamit ng paraan ng resampling ng library ng Pandas. Ang resampling ay isang mahusay na tool na maaaring magamit sa data ng timestamp o data ng serye ng oras upang i-upsample o i-downsample ang mga punto ng data. Sa kasong ito, ibababa namin ang sample ng mga punto ng data upang malikha ang nais na mga panahon.

Ngayon, tingnan natin ang sunud-sunod na paliwanag ng code:

1. Mag-import ng mga kinakailangang aklatan:

import pandas as pd
import numpy as np

2. Gumawa ng sample na dataframe na may timestamp index:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. Sample muli ang data ng time-series at i-convert ang data ng timestamp sa mga tuldok:

df_period = df.resample('W').sum()

4. I-print ang resultang dataframe:

print(df_period)

Ang huling dataframe na `df_period` ay naglalaman ng kabuuan ng orihinal na data na pinagsama-sama ng linggo.

**Pag-unawa sa Mga Aklatan at Mga Gamit na Ginamit**

Pandas Library

Ang Pandas ay isang malawakang ginagamit na library ng Python para sa pagmamanipula at pagsusuri ng data. Nagbibigay ito ng mataas na antas ng mga istruktura ng data tulad ng Serye at DataFrame, na nagbibigay-daan sa mga developer na magsagawa ng mga operasyon tulad ng pagsasama, muling paghubog, at paglilinis nang mabilis at mahusay. Sa aming kaso, tumutulong ang Pandas na pangasiwaan ang data ng timestamp nang epektibo at nagbibigay ng mahahalagang function tulad ng resample() upang i-convert ang data ng timestamp sa mga tuldok.

Pag-andar ng Resample

Ang resample() Ang function sa Pandas ay isang maginhawang paraan para sa frequency conversion at resampling ng data ng time series. Nagbibigay ito ng maraming opsyon para sa pagsasama-sama ng data o downsampling, kabilang ang sum, mean, median, mode, at iba pang mga function na tinukoy ng user. Ginagamit namin ang function na ito upang i-convert ang aming data ng timestamp sa isang lingguhang panahon sa pamamagitan ng pagtukoy sa dalas ng resampling bilang 'W'. Maaari mo ring gamitin ang 'M' para sa buwanan, 'Q' para sa quarterly, at iba pa.

Ngayong na-explore na namin ang functionality ng Pandas at ang resample function para sa pag-convert ng timestamp sa period data, madali na naming mahahawakan ang data na sensitibo sa oras sa mas makabuluhang paraan. Sa tulong ng mga tool na ito, maa-unlock ng mga developer, data analyst, at SEO specialist ang mga natatanging insight mula sa kanilang data, na tumutulong sa kanila na gumawa ng mas mahuhusay na desisyon at hula.

Kaugnay na mga post:

Mag-iwan ng komento