تم حلها: كيفية حذف أيام تاريخ الباندا

قد تبدو الموضة والبرمجة وكأنهما عالمان مختلفان تمامًا ، ولكن عندما يتعلق الأمر بتحليل البيانات والتنبؤ بالاتجاهات ، يمكن أن يجتمعا معًا بشكل جميل. في هذه المقالة ، سوف نستكشف مشكلة شائعة لتحليل البيانات في صناعة الأزياء: حذف أيام معينة من بيانات وقت الباندا. يمكن أن يكون هذا مفيدًا بشكل خاص عند تحليل الأنماط والاتجاهات وبيانات المبيعات. سنستعرض شرحًا تفصيليًا للرمز ، وسنناقش العديد من المكتبات والوظائف التي ستساعدنا في تحقيق هدفنا.

الباندا و Datetime في الموضة

Pandas هي مكتبة Python شائعة الاستخدام بشكل أساسي لتحليل البيانات ومعالجتها. في عالم الموضة ، يمكن استخدامه لفحص كميات هائلة من البيانات لتحديد الاتجاهات وتحليل تفضيلات العملاء والتنبؤ بالأنماط المستقبلية. يدعم Pandas وظائف التاريخ والوقت ، مما يسمح لنا بالعمل مع التواريخ والأوقات دون عناء.

في كثير من الحالات ، من الضروري حذف أيام أو نطاقات أيام معينة من مجموعة البيانات الخاصة بنا. على سبيل المثال ، قد نرغب في استبعاد عطلات نهاية الأسبوع أو العطلات للتركيز على أيام التخفيضات المهمة ، مثل الجمعة السوداء أو إثنين الإنترنت.

فهم المشكلة

لنفترض أن لدينا مجموعة بيانات تحتوي على بيانات المبيعات اليومية بتنسيق CSV ، ونريد تحليل المعلومات مع استبعاد عطلات نهاية الأسبوع. لتحقيق ذلك ، سنبدأ بـ استيراد مجموعة البيانات باستخدام الباندا ، وبعد ذلك سنقوم بمعالجة البيانات لإزالة عطلات نهاية الأسبوع.

إليك عملية التقديم خطوة بخطوة:

1. استيراد المكتبات اللازمة.
2. قم بتحميل مجموعة البيانات.
3. قم بتحويل عمود التاريخ إلى تنسيق التاريخ والوقت (إذا لم يكن بهذا التنسيق بالفعل).
4. قم بتصفية إطار البيانات لاستبعاد عطلات نهاية الأسبوع.
5. تحليل البيانات المصفاة.

ملحوظة: يمكن تطبيق هذه الطريقة على أي مجموعة بيانات حيث يتم تخزين التاريخ في عمود منفصل.

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

تفسير المدونة

في كتلة التعليمات البرمجية أعلاه ، نبدأ باستيراد مكتبتين أساسيتين: pandas و BDay (يوم عمل) من pandas.tseries.offsets. نقوم بتحميل مجموعة البيانات باستخدام وظيفة الباندا read_csv، وتأكد من أن عمود التاريخ بتنسيق datetime.

dt.dayofweek إرجاع يوم الأسبوع كعدد صحيح (الاثنين: 0 ، الأحد: 6). لتصفية عطلات نهاية الأسبوع ، نحتفظ فقط بالصفوف ذات القيمة اليومية في الأسبوع أقل من 5.

أخيرًا ، نقوم بتحليل البيانات التي تمت تصفيتها عن طريق طباعة الصفوف القليلة الأولى باستخدام ملف رأس() وظيفة.

وظائف ومكتبات إضافية

يمكن تمديد هذه الطريقة بشكل أكبر لتشمل معايير تصفية أخرى أو للعمل مع نطاقات زمنية مختلفة. تتضمن بعض المكتبات والوظائف المفيدة التي يمكن أن تدعم هذه العملية ما يلي:

  • رقمبي: مكتبة للحوسبة الرقمية في بايثون ، والتي يمكن استخدامها لمعالجة الصفيف والعمليات الرياضية بكفاءة.
  • التاريخ والوقت: وحدة في مكتبة Python القياسية تساعدنا في التعامل مع التواريخ والأوقات بسهولة.
  • نطاق الموعد: وظيفة داخل الباندا تسمح لنا بإنشاء نطاق من التواريخ وفقًا لإعدادات التردد المختلفة ، مثل أيام العمل أو الأسابيع أو الأشهر.

من خلال الاستفادة من هذه الأدوات والتقنيات جنبًا إلى جنب مع الباندا ومعالجة التاريخ والوقت ، يمكنك إنشاء تدفقات عمل قوية لتحليل البيانات تلبي الاحتياجات المحددة لصناعة الأزياء ، مثل تحديد الاتجاهات وتفضيلات العملاء وأداء المبيعات.

الوظائف ذات الصلة:

اترك تعليق