फॅशन आणि प्रोग्रामिंग दोन पूर्णपणे भिन्न जगांसारखे वाटू शकते, परंतु जेव्हा डेटा विश्लेषण आणि ट्रेंड अंदाज येतो तेव्हा ते सुंदरपणे एकत्र येऊ शकतात. या लेखात, आम्ही फॅशन उद्योगातील डेटा विश्लेषणासाठी एक सामान्य समस्या शोधू: पांडा डेटटाइम डेटामधून विशिष्ट दिवस वगळणे. नमुने, ट्रेंड आणि विक्री डेटाचे विश्लेषण करताना हे विशेषतः उपयुक्त ठरू शकते. आम्ही कोडचे चरण-दर-चरण स्पष्टीकरण देऊ आणि विविध लायब्ररी आणि फंक्शन्सवर चर्चा करू जे आम्हाला आमचे ध्येय साध्य करण्यात मदत करतील.
फॅशन मध्ये पांडा आणि तारीख वेळ
पांडा ही एक लोकप्रिय पायथन लायब्ररी आहे जी प्रामुख्याने डेटा विश्लेषण आणि हाताळणीसाठी वापरली जाते. फॅशनच्या जगात, ट्रेंड ओळखण्यासाठी, ग्राहकांच्या प्राधान्यांचे विश्लेषण करण्यासाठी आणि भविष्यातील नमुन्यांची भविष्यवाणी करण्यासाठी मोठ्या प्रमाणावर डेटा चाळण्यासाठी याचा वापर केला जाऊ शकतो. Pandas डेटटाइम कार्यक्षमतेचे समर्थन करते, आम्हाला तारखा आणि वेळेसह सहजतेने कार्य करण्यास अनुमती देते.
अनेक प्रकरणांमध्ये, आमच्या डेटासेटमधून विशिष्ट दिवस किंवा दिवसांची श्रेणी वगळणे आवश्यक आहे. उदाहरणार्थ, ब्लॅक फ्रायडे किंवा सायबर सोमवार सारख्या महत्त्वाच्या विक्रीच्या दिवसांवर लक्ष केंद्रित करण्यासाठी आम्ही शनिवार व रविवार किंवा सुट्टीचे दिवस वगळू इच्छितो.
समस्या समजून घेणे
समजा आमच्याकडे CSV फॉरमॅटमध्ये दैनिक विक्री डेटा असलेला डेटासेट आहे आणि आम्ही वीकेंड वगळून माहितीचे विश्लेषण करू इच्छितो. हे साध्य करण्यासाठी, आम्ही सुरुवात करू पांडा वापरून डेटासेट इंपोर्ट करत आहे आणि नंतर आठवड्याचे शेवटचे दिवस काढण्यासाठी आम्ही डेटामध्ये फेरफार करू.
येथे चरण-दर-चरण प्रक्रिया आहे:
1. आवश्यक लायब्ररी आयात करा.
2. डेटासेट लोड करा.
3. तारीख स्तंभ डेटटाइम फॉरमॅटमध्ये रूपांतरित करा (जर आधीपासून त्या फॉरमॅटमध्ये नसेल).
4. शनिवार व रविवार वगळण्यासाठी डेटाफ्रेम फिल्टर करा.
5. फिल्टर केलेल्या डेटाचे विश्लेषण करा.
टीप: ही पद्धत कोणत्याही डेटासेटवर लागू केली जाऊ शकते जिथे तारीख वेगळ्या स्तंभात संग्रहित केली जाते.
# Step 1: Import the necessary libraries import pandas as pd from pandas.tseries.offsets import BDay # Step 2: Load the dataset data = pd.read_csv('sales_data.csv') # Step 3: Convert the date column to datetime format data['date'] = pd.to_datetime(data['date']) # Step 4: Filter the dataframe to exclude weekends filtered_data = data[data['date'].dt.dayofweek < 5] # Step 5: Analyze the filtered data print(filtered_data.head())
संहितेचा अर्थ लावणे
वरील कोड ब्लॉकमध्ये, आम्ही दोन आवश्यक लायब्ररी आयात करून सुरुवात करतो: pandas.tseries.offsets वरून pandas आणि BDay (व्यवसाय दिवस). आम्ही pandas फंक्शन वापरून डेटासेट लोड करतो read_csv, आणि तारीख कॉलम डेटटाइम फॉरमॅटमध्ये असल्याची खात्री करा.
अगोदर निर्देश केलेल्या बाबीसंबंधी बोलताना आठवड्याचा दिवस विशेषता आठवड्याचा दिवस पूर्णांक म्हणून परत करते (सोमवार: 0, रविवार: 6). आठवड्याचे शेवटचे दिवस फिल्टर करण्यासाठी, आम्ही फक्त आठवड्याच्या दिवसाचे मूल्य ५ पेक्षा कमी असलेल्या पंक्ती ठेवतो.
शेवटी, आम्ही वापरून पहिल्या काही पंक्ती मुद्रित करून फिल्टर केलेल्या डेटाचे विश्लेषण करतो डोके() कार्य
अतिरिक्त कार्ये आणि लायब्ररी
इतर फिल्टरिंग निकष समाविष्ट करण्यासाठी किंवा भिन्न तारीख श्रेणींमध्ये कार्य करण्यासाठी ही पद्धत आणखी वाढविली जाऊ शकते. या प्रक्रियेस समर्थन देणारी काही उपयुक्त लायब्ररी आणि कार्ये समाविष्ट आहेत:
- numPy: Python मध्ये संख्यात्मक संगणनासाठी एक लायब्ररी, ज्याचा वापर कार्यक्षम अॅरे मॅनिपुलेशन आणि गणितीय ऑपरेशन्ससाठी केला जाऊ शकतो.
- तारीख वेळ: पायथनच्या मानक लायब्ररीमधील एक मॉड्यूल जे आम्हाला तारखा आणि वेळेसह सहजपणे कार्य करण्यास मदत करते.
- तारीख श्रेणी: पांडामधील एक कार्य जे आम्हाला वेगवेगळ्या वारंवारता सेटिंग्जनुसार तारखांची श्रेणी तयार करण्यास अनुमती देते, जसे की व्यवसाय दिवस, आठवडे किंवा महिने.
पांडा आणि डेटटाइम मॅनिपुलेशनच्या संयोगाने ही साधने आणि तंत्रे वापरून, तुम्ही मजबूत डेटा विश्लेषण वर्कफ्लो तयार करू शकता जे फॅशन उद्योगाच्या विशिष्ट गरजा पूर्ण करतात, जसे की ट्रेंड ओळखणे, ग्राहक प्राधान्ये आणि विक्री कार्यप्रदर्शन.