แฟชั่นและการเขียนโปรแกรมอาจดูเหมือนเป็นโลกสองใบที่แตกต่างกันอย่างสิ้นเชิง แต่เมื่อพูดถึงการวิเคราะห์ข้อมูลและการคาดการณ์แนวโน้ม ทั้งสองสามารถเข้ากันได้อย่างสวยงาม ในบทความนี้ เราจะสำรวจปัญหาทั่วไปสำหรับการวิเคราะห์ข้อมูลในอุตสาหกรรมแฟชั่น: การละเว้นวันที่ระบุจากข้อมูลวันที่และเวลาของหมีแพนด้า สิ่งนี้มีประโยชน์อย่างยิ่งเมื่อวิเคราะห์รูปแบบ แนวโน้ม และข้อมูลการขาย เราจะอธิบายทีละขั้นตอนของโค้ด และหารือเกี่ยวกับไลบรารีและฟังก์ชันต่างๆ ที่จะช่วยให้เราบรรลุเป้าหมาย
แพนด้าและวันเวลาในแฟชั่น
Pandas เป็นไลบรารี Python ยอดนิยมที่ใช้สำหรับการวิเคราะห์และจัดการข้อมูลเป็นหลัก ในโลกของแฟชั่น มันสามารถใช้ในการกรองข้อมูลจำนวนมหาศาลเพื่อระบุแนวโน้ม วิเคราะห์ความพึงพอใจของลูกค้า และทำนายรูปแบบในอนาคต Pandas รองรับฟังก์ชันวันที่และเวลา ทำให้เราสามารถทำงานกับวันที่และเวลาได้อย่างง่ายดาย
ในหลายกรณี จำเป็นต้องละวันหรือช่วงวันที่เจาะจงออกจากชุดข้อมูลของเรา ตัวอย่างเช่น เราอาจต้องการยกเว้นวันหยุดสุดสัปดาห์หรือวันหยุดนักขัตฤกษ์เพื่อมุ่งเน้นไปที่วันลดราคาที่สำคัญ เช่น แบล็คฟรายเดย์หรือไซเบอร์มันเดย์
ทำความเข้าใจกับปัญหา
สมมติว่าเรามีชุดข้อมูลที่มีข้อมูลการขายรายวันในรูปแบบ CSV และเราต้องการวิเคราะห์ข้อมูลโดยไม่รวมวันหยุดสุดสัปดาห์ เพื่อให้บรรลุเป้าหมายนี้ เราจะเริ่มต้นด้วย นำเข้าชุดข้อมูลโดยใช้แพนด้า จากนั้นเราจะจัดการข้อมูลเพื่อลบวันหยุดสุดสัปดาห์
นี่คือกระบวนการทีละขั้นตอน:
1. นำเข้าไลบรารีที่จำเป็น
2. โหลดชุดข้อมูล
3. แปลงคอลัมน์วันที่เป็นรูปแบบวันที่และเวลา (หากยังไม่ได้อยู่ในรูปแบบนั้น)
4. กรอง dataframe เพื่อไม่รวมวันหยุดสุดสัปดาห์
5. วิเคราะห์ข้อมูลที่กรอง
หมายเหตุ วิธีนี้ใช้ได้กับชุดข้อมูลใดๆ ที่จัดเก็บวันที่ในคอลัมน์แยกต่างหาก
# Step 1: Import the necessary libraries import pandas as pd from pandas.tseries.offsets import BDay # Step 2: Load the dataset data = pd.read_csv('sales_data.csv') # Step 3: Convert the date column to datetime format data['date'] = pd.to_datetime(data['date']) # Step 4: Filter the dataframe to exclude weekends filtered_data = data[data['date'].dt.dayofweek < 5] # Step 5: Analyze the filtered data print(filtered_data.head())
การตีความรหัส
ในบล็อกโค้ดด้านบน เราเริ่มต้นด้วยการนำเข้าไลบรารีที่จำเป็นสองรายการ ได้แก่ pandas และ BDay (วันทำการ) จาก pandas.tseries.offsets เราโหลดชุดข้อมูลโดยใช้ฟังก์ชันแพนด้า read_csvและตรวจสอบให้แน่ใจว่าคอลัมน์วันที่อยู่ในรูปแบบวันที่และเวลา
พื้นที่ dt.dayofweek แอตทริบิวต์ส่งคืนวันในสัปดาห์เป็นจำนวนเต็ม (วันจันทร์: 0, วันอาทิตย์: 6) ในการกรองวันหยุดสุดสัปดาห์ เราจะเก็บเฉพาะแถวที่มีค่า dayofweek น้อยกว่า 5
สุดท้าย เราวิเคราะห์ข้อมูลที่กรองโดยการพิมพ์สองสามแถวแรกโดยใช้ ศีรษะ() ฟังก์ชัน
ฟังก์ชันและไลบรารีเพิ่มเติม
วิธีนี้สามารถขยายเพิ่มเติมเพื่อรวมเกณฑ์การกรองอื่นๆ หรือเพื่อใช้งานกับช่วงวันที่ที่แตกต่างกัน ไลบรารีและฟังก์ชันที่มีประโยชน์บางอย่างที่สามารถรองรับกระบวนการนี้ ได้แก่:
- จำนวนปี: ไลบรารีสำหรับการคำนวณเชิงตัวเลขใน Python ซึ่งสามารถใช้สำหรับการจัดการอาร์เรย์และการดำเนินการทางคณิตศาสตร์อย่างมีประสิทธิภาพ
- วันเวลา: โมดูลในไลบรารีมาตรฐานของ Python ที่ช่วยให้เราทำงานกับวันที่และเวลาได้อย่างง่ายดาย
- ช่วงวันที่: ฟังก์ชันภายในแพนด้าที่ช่วยให้เราสร้างช่วงวันที่ตามการตั้งค่าความถี่ต่างๆ เช่น วันทำการ สัปดาห์ หรือเดือน
ด้วยการใช้ประโยชน์จากเครื่องมือและเทคนิคเหล่านี้ร่วมกับแพนด้าและการจัดการวันที่และเวลา คุณจะสามารถสร้างเวิร์กโฟลว์การวิเคราะห์ข้อมูลที่มีประสิทธิภาพซึ่งตอบสนองความต้องการเฉพาะของอุตสาหกรรมแฟชั่น เช่น การระบุแนวโน้ม ความพึงพอใจของลูกค้า และประสิทธิภาพการขาย