Вирішено: перетворити мітку часу на період панд

У сучасному світі робота з даними часових рядів є важливою навичкою для розробника. Одним із поширених завдань є перетворення мітки часу в певний період, наприклад тижневі або місячні дані. Ця операція має вирішальне значення для різних аналізів, наприклад вивчення тенденцій і закономірностей у даних. У цій статті ми розглянемо, як перетворити позначку часу в період у наборі даних часових рядів за допомогою потужної бібліотеки Python Pandas. Ми також глибоко зануримося в код, вивчимо бібліотеки та функції, задіяні в процесі, і зрозуміємо їхнє значення для вирішення цієї проблеми.

Pandas — це бібліотека для аналізу та обробки даних із відкритим кодом, яка надає гнучкі та високопродуктивні функції для роботи з даними часових рядів. Це робить наше завдання простим, точним і ефективним.

Рішення для перетворення даних часових позначок у певний період, наприклад щотижня або щомісяця, передбачає використання методу повторної вибірки бібліотеки Pandas. Повторна дискретизація — це потужний інструмент, який можна використовувати для даних часових позначок або даних часових рядів для підвищення або зменшення дискретизації точок даних. У цьому випадку ми зменшимо вибірку точок даних, щоб створити потрібні періоди.

Тепер давайте подивимося на покрокове пояснення коду:

1. Імпортуйте необхідні бібліотеки:

import pandas as pd
import numpy as np

2. Створіть зразок кадру даних з індексом мітки часу:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. Повторіть вибірку даних часових рядів і перетворите дані часових позначок на періоди:

df_period = df.resample('W').sum()

4. Роздрукуйте отриманий кадр даних:

print(df_period)

Остаточний фрейм даних df_period містить суму вихідних даних, зведених за тиждень.

**Розуміння використовуваних бібліотек і функцій**

Бібліотека панд

Pandas — це широко використовувана бібліотека Python для обробки та аналізу даних. Він забезпечує високорівневі структури даних, такі як Series і DataFrame, що дозволяє розробникам швидко й ефективно виконувати такі операції, як об’єднання, зміна форми та очищення. У нашому випадку Pandas допомагає ефективно обробляти дані часових позначок і надає такі цінні функції, як resample() для перетворення даних часових позначок у періоди.

Функція повторної вибірки

Команда resample() Функція в Pandas є зручним методом для перетворення частоти та повторної вибірки даних часових рядів. Він надає багато варіантів для агрегування даних або зменшення дискретизації, включаючи суму, середнє значення, медіану, режим та інші функції, визначені користувачем. Ми використовуємо цю функцію, щоб перетворити наші дані часових позначок у тижневий період, вказавши частоту повторної дискретизації як «W». Ви також можете використовувати «M» для місячних, «Q» для квартальних і так далі.

Тепер, коли ми дослідили функціональні можливості Pandas і функцію resample для перетворення міток часу в дані періоду, ми можемо легко обробляти чутливі до часу дані більш змістовним способом. За допомогою цих інструментів розробники, аналітики даних і спеціалісти з оптимізації пошукових систем можуть отримувати унікальну інформацію зі своїх даних, допомагаючи їм приймати кращі рішення та прогнозувати.

Схожі повідомлення:

Залишити коментар