Решено: преобразувайте клеймото за време в периодични панди

В днешния свят работата с данни от времеви серии е основно умение за разработчика. Една от обичайните задачи е да конвертирате клеймо за време в определен период, като седмични или месечни данни. Тази операция е от решаващо значение за различни анализи, като изучаване на тенденции и модели в данните. В тази статия ще проучим как да преобразуваме клеймо за време в период в набор от данни за времеви серии, като използваме мощната библиотека на Python, Pandas. Освен това ще се потопим дълбоко в кода, ще проучим библиотеките и функциите, участващи в процеса, и ще разберем тяхното значение за решаването на този проблем.

Pandas е библиотека за анализ и манипулиране на данни с отворен код, която предоставя гъвкави и високоефективни функции за работа с данни от времеви серии. Това прави нашата задача проста, точна и ефективна.

Решението за преобразуване на данни за времеви клейма в конкретен период, като седмичен или месечен, включва използването на метода за повторно вземане на проби на библиотеката Pandas. Повторното вземане на проби е мощен инструмент, който може да се използва върху данни с клеймо за време или данни от времеви серии за повишаване или намаляване на разделителната способност на точките от данни. В този случай ще намалим семплирането на точките от данни, за да създадем желаните периоди.

Сега нека да разгледаме стъпка по стъпка обяснението на кода:

1. Импортирайте необходимите библиотеки:

import pandas as pd
import numpy as np

2. Създайте примерен кадър с данни с индекс на времево клеймо:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. Преобразувайте данните от времевите серии и преобразувайте данните от времевия печат в периоди:

df_period = df.resample('W').sum()

4. Отпечатайте получения кадър с данни:

print(df_period)

Крайният кадър с данни „df_period“ съдържа сумата от оригиналните данни, обобщени по седмица.

**Разбиране на използваните библиотеки и функции**

Библиотека Pandas

Pandas е широко използвана библиотека на Python за манипулиране и анализ на данни. Той предоставя структури от данни на високо ниво като Series и DataFrame, позволявайки на разработчиците да извършват операции като сливане, преоформяне и почистване бързо и ефективно. В нашия случай Pandas помага за ефективното обработване на данните от времевия печат и предоставя ценни функции като resample() за преобразуване на данните от времевия печат в периоди.

Функция за повторно семплиране

- повторна проба () функцията в Pandas е удобен метод за честотно преобразуване и повторна дискретизация на данни от времеви серии. Той предоставя много опции за агрегиране на данни или намаляване на дискретизацията, включително сума, средна стойност, медиана, режим и други дефинирани от потребителя функции. Ние използваме тази функция, за да преобразуваме нашите данни за дата и време в седмичен период, като посочим честотата на повторно вземане на проби като „W“. Можете също да използвате „M“ за месечно, „Q“ за тримесечно и т.н.

Сега, след като проучихме функционалността на Pandas и функцията за преобразуване за преобразуване на времево клеймо в данни за периоди, можем лесно да обработваме чувствителни към времето данни по по-смислен начин. С помощта на тези инструменти разработчиците, анализаторите на данни и специалистите по SEO могат да отключат уникални прозрения от своите данни, като им помагат да вземат по-добри решения и прогнози.

Подобни публикации:

Оставете коментар