ในโลกปัจจุบัน การทำงานกับข้อมูลอนุกรมเวลาเป็นทักษะที่จำเป็นสำหรับนักพัฒนา งานทั่วไปอย่างหนึ่งคือการแปลงการประทับเวลาเป็นช่วงเวลาที่ระบุ เช่น ข้อมูลรายสัปดาห์หรือรายเดือน การดำเนินการนี้มีความสำคัญอย่างยิ่งต่อการวิเคราะห์ต่างๆ เช่น การศึกษาแนวโน้มและรูปแบบในข้อมูล ในบทความนี้ เราจะสำรวจวิธีแปลงการประทับเวลาเป็นช่วงเวลาในชุดข้อมูลอนุกรมเวลาโดยใช้ไลบรารี Python อันทรงพลังอย่าง Pandas นอกจากนี้ เราจะเจาะลึกลงไปในโค้ด สำรวจไลบรารีและฟังก์ชันที่เกี่ยวข้องในกระบวนการ และทำความเข้าใจถึงความสำคัญในการแก้ปัญหานี้
Pandas เป็นไลบรารีการวิเคราะห์และการจัดการข้อมูลแบบโอเพ่นซอร์ส ซึ่งมีฟังก์ชันที่ยืดหยุ่นและมีประสิทธิภาพสูงในการทำงานกับข้อมูลอนุกรมเวลา ทำให้งานของเราง่าย แม่นยำ และมีประสิทธิภาพ
วิธีแก้ปัญหาในการแปลงข้อมูลการประทับเวลาเป็นช่วงเวลาเฉพาะ เช่น รายสัปดาห์หรือรายเดือน เกี่ยวข้องกับการใช้วิธีการสุ่มใหม่ของห้องสมุด Pandas การสุ่มตัวอย่างซ้ำเป็นเครื่องมือที่มีประสิทธิภาพที่สามารถใช้กับข้อมูลการประทับเวลาหรือข้อมูลอนุกรมเวลาเพื่อสุ่มตัวอย่างเพิ่มหรือสุ่มตัวอย่างจุดข้อมูล ในกรณีนี้ เราจะสุ่มตัวอย่างจุดข้อมูลเพื่อสร้างช่วงเวลาที่ต้องการ
ตอนนี้ มาดูคำอธิบายทีละขั้นตอนของโค้ด:
1. นำเข้าไลบรารีที่จำเป็น:
import pandas as pd import numpy as np
2. สร้าง dataframe ตัวอย่างพร้อมดัชนีการประทับเวลา:
date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D') df = pd.DataFrame(date_rng, columns=['date']) df['data'] = np.random.randint(0,100,size=(len(date_rng))) df.set_index('date', inplace=True)
3. สุ่มตัวอย่างข้อมูลอนุกรมเวลาใหม่และแปลงข้อมูลการประทับเวลาเป็นช่วงเวลา:
df_period = df.resample('W').sum()
4. พิมพ์ dataframe ผลลัพธ์:
print(df_period)
dataframe สุดท้าย `df_period` มีผลรวมของข้อมูลเดิมที่รวบรวมตามสัปดาห์
**ทำความเข้าใจเกี่ยวกับไลบรารีและฟังก์ชันที่ใช้**
ห้องสมุดหมีแพนด้า
Pandas เป็นไลบรารี Python ที่ใช้กันอย่างแพร่หลายสำหรับการจัดการและวิเคราะห์ข้อมูล มีโครงสร้างข้อมูลระดับสูง เช่น Series และ DataFrame ช่วยให้นักพัฒนาสามารถดำเนินการต่างๆ เช่น การผสาน การปรับรูปร่าง และการทำความสะอาดได้อย่างรวดเร็วและมีประสิทธิภาพ ในกรณีของเรา Pandas ช่วยจัดการข้อมูลการประทับเวลาอย่างมีประสิทธิภาพและจัดเตรียมฟังก์ชันที่มีประโยชน์ เช่น resample() เพื่อแปลงข้อมูลการประทับเวลาเป็นช่วงเวลา
ตัวอย่างฟังก์ชั่น
พื้นที่ ตัวอย่าง () ฟังก์ชันใน Pandas เป็นวิธีการที่สะดวกสำหรับการแปลงความถี่และการสุ่มตัวอย่างข้อมูลอนุกรมเวลาใหม่ มีตัวเลือกมากมายสำหรับการรวมข้อมูลหรือการสุ่มตัวอย่าง รวมถึงผลรวม ค่าเฉลี่ย ค่ามัธยฐาน โหมด และฟังก์ชันอื่นๆ ที่ผู้ใช้กำหนด เราใช้ฟังก์ชันนี้เพื่อแปลงข้อมูลการประทับเวลาเป็นช่วงเวลารายสัปดาห์โดยระบุความถี่การสุ่มใหม่เป็น 'W' คุณยังสามารถใช้ 'M' สำหรับรายเดือน 'Q' สำหรับรายไตรมาส และอื่น ๆ
ตอนนี้เราได้สำรวจฟังก์ชันการทำงานของ Pandas และฟังก์ชัน resample สำหรับการแปลงการประทับเวลาเป็นข้อมูลช่วงเวลาแล้ว เราสามารถจัดการกับข้อมูลที่มีความสำคัญต่อเวลาได้อย่างง่ายดายด้วยวิธีที่มีความหมายมากขึ้น ด้วยความช่วยเหลือของเครื่องมือเหล่านี้ นักพัฒนา นักวิเคราะห์ข้อมูล และผู้เชี่ยวชาญด้าน SEO สามารถปลดล็อกข้อมูลเชิงลึกที่ไม่ซ้ำใครจากข้อมูลของพวกเขา ช่วยให้พวกเขาตัดสินใจและคาดการณ์ได้ดีขึ้น