हल किया गया: पांडा के समय के दिनों को कैसे छोड़ा जाए

फैशन और प्रोग्रामिंग दो पूरी तरह से अलग दुनिया की तरह लग सकते हैं, लेकिन जब डेटा विश्लेषण और प्रवृत्ति पूर्वानुमान की बात आती है, तो वे खूबसूरती से एक साथ आ सकते हैं। इस लेख में, हम फैशन उद्योग में डेटा विश्लेषण के लिए एक आम समस्या का पता लगाएंगे: पांडा डेटाटाइम डेटा से विशिष्ट दिनों को छोड़ना। पैटर्न, रुझान और बिक्री डेटा का विश्लेषण करते समय यह विशेष रूप से उपयोगी हो सकता है। हम कोड की चरण-दर-चरण व्याख्या करेंगे, और विभिन्न पुस्तकालयों और कार्यों पर चर्चा करेंगे जो हमें अपने लक्ष्य को प्राप्त करने में मदद करेंगे।

पांडा और डेटटाइम इन फैशन

पांडा एक लोकप्रिय पायथन पुस्तकालय है जिसका उपयोग मुख्य रूप से डेटा विश्लेषण और हेरफेर के लिए किया जाता है। फैशन की दुनिया में, इसे रुझानों की पहचान करने, ग्राहकों की वरीयताओं का विश्लेषण करने और भविष्य के पैटर्न की भविष्यवाणी करने के लिए बड़ी मात्रा में डेटा के माध्यम से छान-बीन करने के लिए नियोजित किया जा सकता है। पांडा डेटाटाइम कार्यक्षमता का समर्थन करते हैं, जिससे हमें दिनांक और समय के साथ सहजता से काम करने की अनुमति मिलती है।

कई मामलों में, हमारे डेटासेट से विशिष्ट दिनों या दिनों की श्रेणियों को छोड़ना आवश्यक होता है। उदाहरण के लिए, हम ब्लैक फ्राइडे या साइबर मंडे जैसे महत्वपूर्ण बिक्री दिनों पर ध्यान केंद्रित करने के लिए सप्ताहांत या छुट्टियों को बाहर करना चाह सकते हैं।

समस्या को समझना

मान लीजिए कि हमारे पास सीएसवी प्रारूप में दैनिक बिक्री डेटा वाला डेटासेट है, और हम सप्ताहांत को छोड़कर जानकारी का विश्लेषण करना चाहते हैं। इसे हासिल करने के लिए, हम शुरुआत करेंगे पांडा का उपयोग करके डेटासेट आयात करना, और फिर हम सप्ताहांत निकालने के लिए डेटा में हेरफेर करेंगे।

यहां चरण-दर-चरण प्रक्रिया है:

1. आवश्यक पुस्तकालयों का आयात करें।
2. डेटासेट लोड करें।
3. दिनांक कॉलम को डेटाटाइम प्रारूप में बदलें (यदि पहले से ही उस प्रारूप में नहीं है)।
4. सप्ताहांत को बाहर करने के लिए डेटाफ़्रेम को फ़िल्टर करें।
5. फ़िल्टर किए गए डेटा का विश्लेषण करें।

नोट: यह विधि किसी भी डेटासेट पर लागू की जा सकती है जहाँ दिनांक एक अलग कॉलम में संग्रहीत है।

# Step 1: Import the necessary libraries
import pandas as pd
from pandas.tseries.offsets import BDay

# Step 2: Load the dataset
data = pd.read_csv('sales_data.csv')

# Step 3: Convert the date column to datetime format
data['date'] = pd.to_datetime(data['date'])

# Step 4: Filter the dataframe to exclude weekends
filtered_data = data[data['date'].dt.dayofweek < 5]

# Step 5: Analyze the filtered data
print(filtered_data.head())

संहिता की व्याख्या करना

उपरोक्त कोड ब्लॉक में, हम दो आवश्यक पुस्तकालयों को आयात करके शुरू करते हैं: pandas.tseries.offsets से pandas और BDay (व्यावसायिक दिन)। हम पांडा फ़ंक्शन का उपयोग करके डेटासेट लोड करते हैं read_csv, और सुनिश्चित करें कि दिनांक कॉलम डेटाटाइम प्रारूप में है।

RSI सप्ताह का दिन विशेषता सप्ताह के दिन को पूर्णांक के रूप में लौटाती है (सोमवार: 0, रविवार: 6)। सप्ताहांत को फ़िल्टर करने के लिए, हम केवल उन पंक्तियों को रखते हैं जिनका सप्ताह का दिन मान 5 से कम होता है।

अंत में, हम पहले कुछ पंक्तियों का उपयोग करके फ़िल्टर किए गए डेटा का विश्लेषण करते हैं सिर() समारोह.

अतिरिक्त कार्य और पुस्तकालय

अन्य फ़िल्टरिंग मानदंडों को शामिल करने या विभिन्न तिथि सीमाओं के साथ काम करने के लिए इस विधि को और बढ़ाया जा सकता है। कुछ उपयोगी पुस्तकालय और कार्य जो इस प्रक्रिया का समर्थन कर सकते हैं उनमें शामिल हैं:

  • न्यूमपी: पायथन में संख्यात्मक कंप्यूटिंग के लिए एक पुस्तकालय, जिसका उपयोग कुशल सरणी हेरफेर और गणितीय संचालन के लिए किया जा सकता है।
  • दिनांक समय: पायथन के मानक पुस्तकालय में एक मॉड्यूल जो हमें तारीखों और समय के साथ आसानी से काम करने में मदद करता है।
  • तिथि सीमा: पांडा के भीतर एक फ़ंक्शन जो हमें विभिन्न फ़्रीक्वेंसी सेटिंग्स, जैसे व्यावसायिक दिनों, सप्ताहों या महीनों के अनुसार तिथियों की एक श्रृंखला बनाने की अनुमति देता है।

पांडा और डेटाटाइम हेरफेर के साथ इन उपकरणों और तकनीकों का लाभ उठाकर, आप मजबूत डेटा विश्लेषण वर्कफ़्लोज़ बना सकते हैं जो फ़ैशन उद्योग की विशिष्ट आवश्यकताओं को पूरा करते हैं, जैसे रुझान, ग्राहक प्राथमिकताएं और बिक्री प्रदर्शन की पहचान करना।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो