फैशन और प्रोग्रामिंग दो पूरी तरह से अलग दुनिया की तरह लग सकते हैं, लेकिन जब डेटा विश्लेषण और प्रवृत्ति पूर्वानुमान की बात आती है, तो वे खूबसूरती से एक साथ आ सकते हैं। इस लेख में, हम फैशन उद्योग में डेटा विश्लेषण के लिए एक आम समस्या का पता लगाएंगे: पांडा डेटाटाइम डेटा से विशिष्ट दिनों को छोड़ना। पैटर्न, रुझान और बिक्री डेटा का विश्लेषण करते समय यह विशेष रूप से उपयोगी हो सकता है। हम कोड की चरण-दर-चरण व्याख्या करेंगे, और विभिन्न पुस्तकालयों और कार्यों पर चर्चा करेंगे जो हमें अपने लक्ष्य को प्राप्त करने में मदद करेंगे।
पांडा और डेटटाइम इन फैशन
पांडा एक लोकप्रिय पायथन पुस्तकालय है जिसका उपयोग मुख्य रूप से डेटा विश्लेषण और हेरफेर के लिए किया जाता है। फैशन की दुनिया में, इसे रुझानों की पहचान करने, ग्राहकों की वरीयताओं का विश्लेषण करने और भविष्य के पैटर्न की भविष्यवाणी करने के लिए बड़ी मात्रा में डेटा के माध्यम से छान-बीन करने के लिए नियोजित किया जा सकता है। पांडा डेटाटाइम कार्यक्षमता का समर्थन करते हैं, जिससे हमें दिनांक और समय के साथ सहजता से काम करने की अनुमति मिलती है।
कई मामलों में, हमारे डेटासेट से विशिष्ट दिनों या दिनों की श्रेणियों को छोड़ना आवश्यक होता है। उदाहरण के लिए, हम ब्लैक फ्राइडे या साइबर मंडे जैसे महत्वपूर्ण बिक्री दिनों पर ध्यान केंद्रित करने के लिए सप्ताहांत या छुट्टियों को बाहर करना चाह सकते हैं।
समस्या को समझना
मान लीजिए कि हमारे पास सीएसवी प्रारूप में दैनिक बिक्री डेटा वाला डेटासेट है, और हम सप्ताहांत को छोड़कर जानकारी का विश्लेषण करना चाहते हैं। इसे हासिल करने के लिए, हम शुरुआत करेंगे पांडा का उपयोग करके डेटासेट आयात करना, और फिर हम सप्ताहांत निकालने के लिए डेटा में हेरफेर करेंगे।
यहां चरण-दर-चरण प्रक्रिया है:
1. आवश्यक पुस्तकालयों का आयात करें।
2. डेटासेट लोड करें।
3. दिनांक कॉलम को डेटाटाइम प्रारूप में बदलें (यदि पहले से ही उस प्रारूप में नहीं है)।
4. सप्ताहांत को बाहर करने के लिए डेटाफ़्रेम को फ़िल्टर करें।
5. फ़िल्टर किए गए डेटा का विश्लेषण करें।
नोट: यह विधि किसी भी डेटासेट पर लागू की जा सकती है जहाँ दिनांक एक अलग कॉलम में संग्रहीत है।
# Step 1: Import the necessary libraries import pandas as pd from pandas.tseries.offsets import BDay # Step 2: Load the dataset data = pd.read_csv('sales_data.csv') # Step 3: Convert the date column to datetime format data['date'] = pd.to_datetime(data['date']) # Step 4: Filter the dataframe to exclude weekends filtered_data = data[data['date'].dt.dayofweek < 5] # Step 5: Analyze the filtered data print(filtered_data.head())
संहिता की व्याख्या करना
उपरोक्त कोड ब्लॉक में, हम दो आवश्यक पुस्तकालयों को आयात करके शुरू करते हैं: pandas.tseries.offsets से pandas और BDay (व्यावसायिक दिन)। हम पांडा फ़ंक्शन का उपयोग करके डेटासेट लोड करते हैं read_csv, और सुनिश्चित करें कि दिनांक कॉलम डेटाटाइम प्रारूप में है।
RSI सप्ताह का दिन विशेषता सप्ताह के दिन को पूर्णांक के रूप में लौटाती है (सोमवार: 0, रविवार: 6)। सप्ताहांत को फ़िल्टर करने के लिए, हम केवल उन पंक्तियों को रखते हैं जिनका सप्ताह का दिन मान 5 से कम होता है।
अंत में, हम पहले कुछ पंक्तियों का उपयोग करके फ़िल्टर किए गए डेटा का विश्लेषण करते हैं सिर() समारोह.
अतिरिक्त कार्य और पुस्तकालय
अन्य फ़िल्टरिंग मानदंडों को शामिल करने या विभिन्न तिथि सीमाओं के साथ काम करने के लिए इस विधि को और बढ़ाया जा सकता है। कुछ उपयोगी पुस्तकालय और कार्य जो इस प्रक्रिया का समर्थन कर सकते हैं उनमें शामिल हैं:
- न्यूमपी: पायथन में संख्यात्मक कंप्यूटिंग के लिए एक पुस्तकालय, जिसका उपयोग कुशल सरणी हेरफेर और गणितीय संचालन के लिए किया जा सकता है।
- दिनांक समय: पायथन के मानक पुस्तकालय में एक मॉड्यूल जो हमें तारीखों और समय के साथ आसानी से काम करने में मदद करता है।
- तिथि सीमा: पांडा के भीतर एक फ़ंक्शन जो हमें विभिन्न फ़्रीक्वेंसी सेटिंग्स, जैसे व्यावसायिक दिनों, सप्ताहों या महीनों के अनुसार तिथियों की एक श्रृंखला बनाने की अनुमति देता है।
पांडा और डेटाटाइम हेरफेर के साथ इन उपकरणों और तकनीकों का लाभ उठाकर, आप मजबूत डेटा विश्लेषण वर्कफ़्लोज़ बना सकते हैं जो फ़ैशन उद्योग की विशिष्ट आवश्यकताओं को पूरा करते हैं, जैसे रुझान, ग्राहक प्राथमिकताएं और बिक्री प्रदर्शन की पहचान करना।