У данашњем свету, рад са подацима временских серија је неопходна вештина за програмера. Један од уобичајених задатака је претварање временске ознаке у одређени период, као што су недељни или месечни подаци. Ова операција је кључна за различите анализе, попут проучавања трендова и образаца у подацима. У овом чланку ћемо истражити како да конвертујемо временску ознаку у период у скупу података временске серије користећи моћну Питхон библиотеку, Пандас. Такође ћемо дубоко заронити у код, истражити библиотеке и функције укључене у процес и разумети њихов значај у решавању овог проблема.
Пандас је библиотека отвореног кода за анализу и манипулацију података, која пружа флексибилне функције са високим учинком за рад са подацима временских серија. То чини наш задатак једноставним, тачним и ефикасним.
Решење за претварање података временске ознаке у одређени период, на пример недељно или месечно, укључује коришћење методе поновног узорковања Пандас библиотеке. Поновно узорковање је моћан алат који се може користити на подацима о временским ознакама или подацима временских серија за повећање или смањење узорковања тачака података. У овом случају ћемо смањити узорковање тачака података да бисмо креирали жељене периоде.
Сада, погледајмо објашњење кода корак по корак:
1. Увезите потребне библиотеке:
import pandas as pd import numpy as np
2. Направите пример оквира података са индексом временске ознаке:
date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D') df = pd.DataFrame(date_rng, columns=['date']) df['data'] = np.random.randint(0,100,size=(len(date_rng))) df.set_index('date', inplace=True)
3. Поново узоркујте податке временске серије и конвертујте податке временске ознаке у периоде:
df_period = df.resample('W').sum()
4. Одштампајте резултујући оквир података:
print(df_period)
Коначни оквир података „дф_период“ садржи збир оригиналних података агрегираних по седмици.
**Разумевање библиотека и коришћених функција**
Пандас Либрари
Пандас је широко коришћена Питхон библиотека за манипулацију и анализу података. Обезбеђује структуре података високог нивоа као што су серије и ДатаФраме, омогућавајући програмерима да брзо и ефикасно изводе операције као што су спајање, преобликовање и чишћење. У нашем случају, Пандас помаже ефикасно руковање подацима временске ознаке и пружа вредне функције као што је ресампле() за претварање података временске ознаке у тачке.
Ресампле Функција
ресампле() функција у Пандас-у је згодан метод за конверзију фреквенције и поновно узорковање података временских серија. Пружа много опција за агрегацију података или смањење узорковања, укључујући збир, средњу вредност, медијану, режим и друге функције које дефинише корисник. Користимо ову функцију да конвертујемо наше податке временске ознаке у недељни период тако што ћемо навести учесталост поновног узорковања као 'В'. Такође можете користити 'М' за месечне, 'К' за кварталне итд.
Сада када смо истражили функционалност Панда-а и функцију ресампле за претварање временске ознаке у податке периода, лако можемо да рукујемо временски осетљивим подацима на смисленији начин. Уз помоћ ових алата, програмери, аналитичари података и СЕО стручњаци могу откључати јединствене увиде из својих података, помажући им да донесу боље одлуке и предвиђања.