हल: टाइमस्टैम्प को पीरियड पांडा में बदलें

आज की दुनिया में, समय-श्रृंखला डेटा के साथ काम करना एक डेवलपर के लिए एक आवश्यक कौशल है। सामान्य कार्यों में से एक टाइमस्टैम्प को एक विशिष्ट अवधि में परिवर्तित करना है, जैसे साप्ताहिक या मासिक डेटा। यह ऑपरेशन विभिन्न विश्लेषणों के लिए महत्वपूर्ण है, जैसे डेटा में रुझान और पैटर्न का अध्ययन करना। इस लेख में, हम यह पता लगाएंगे कि शक्तिशाली पायथन लाइब्रेरी, पांडा का उपयोग करके टाइम-सीरीज़ डेटासेट में टाइमस्टैम्प को पीरियड में कैसे बदला जाए। हम कोड में गहराई से गोता लगाएंगे, प्रक्रिया में शामिल पुस्तकालयों और कार्यों का पता लगाएंगे और इस समस्या को हल करने में उनके महत्व को समझेंगे।

पांडा एक ओपन-सोर्स डेटा विश्लेषण और हेरफेर लाइब्रेरी है, जो समय-श्रृंखला डेटा के साथ काम करने के लिए लचीले और उच्च प्रदर्शन वाले कार्य प्रदान करता है। यह हमारे कार्य को सरल, सटीक और कुशल बनाता है।

टाइमस्टैम्प डेटा को एक विशिष्ट अवधि, जैसे कि साप्ताहिक या मासिक में बदलने का समाधान, पंडों के पुस्तकालय की पुनरुत्पादन विधि का उपयोग करना शामिल है। रीसैंपलिंग एक शक्तिशाली उपकरण है जिसका उपयोग टाइमस्टैम्प डेटा या टाइम सीरीज़ डेटा पर या तो डेटा पॉइंट्स को अपसैंपल या डाउनसैंपल करने के लिए किया जा सकता है। इस मामले में, हम वांछित अवधि बनाने के लिए डेटा बिंदुओं को घटा देंगे।

अब, आइए कोड की चरण-दर-चरण व्याख्या देखें:

1. आवश्यक पुस्तकालय आयात करें:

import pandas as pd
import numpy as np

2. टाइमस्टैम्प इंडेक्स के साथ एक नमूना डेटाफ़्रेम बनाएँ:

date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
df = pd.DataFrame(date_rng, columns=['date'])
df['data'] = np.random.randint(0,100,size=(len(date_rng)))
df.set_index('date', inplace=True)

3. टाइम-सीरीज़ डेटा को फिर से सैंपल करें और टाइमस्टैम्प डेटा को पीरियड्स में बदलें:

df_period = df.resample('W').sum()

4. परिणामी डेटाफ़्रेम प्रिंट करें:

print(df_period)

अंतिम डेटाफ़्रेम `df_period` में सप्ताह के अनुसार एकत्र किए गए मूल डेटा का योग होता है।

**उपयोग की जाने वाली लाइब्रेरी और कार्यों को समझना**

पंडों की लाइब्रेरी

पांडा डेटा हेरफेर और विश्लेषण के लिए व्यापक रूप से उपयोग किया जाने वाला पायथन पुस्तकालय है। यह श्रृंखला और डेटाफ़्रेम जैसी उच्च-स्तरीय डेटा संरचनाएँ प्रदान करता है, जिससे डेवलपर्स मर्जिंग, रीशेपिंग और सफाई जैसे कार्यों को जल्दी और कुशलता से करने की अनुमति देते हैं। हमारे मामले में, पांडा टाइमस्टैम्प डेटा को प्रभावी ढंग से संभालने में मदद करता है और टाइमस्टैम्प डेटा को अवधियों में बदलने के लिए resample() जैसे मूल्यवान कार्य प्रदान करता है।

नमूना समारोह

RSI पुनः नमूना() पंडों में फ़ंक्शन आवृत्ति रूपांतरण और समय श्रृंखला डेटा के पुन: नमूनाकरण के लिए एक सुविधाजनक तरीका है। यह डेटा एकत्रीकरण या डाउनसैंपलिंग के लिए कई विकल्प प्रदान करता है, जिसमें योग, माध्य, माध्यिका, मोड और अन्य उपयोगकर्ता-परिभाषित फ़ंक्शन शामिल हैं। हम इस फ़ंक्शन का उपयोग अपने टाइमस्टैम्प डेटा को एक साप्ताहिक अवधि में बदलने के लिए करते हैं, जो कि रीसैंपलिंग आवृत्ति को 'W' के रूप में निर्दिष्ट करता है। आप मासिक के लिए 'M', त्रैमासिक के लिए 'Q', इत्यादि का भी उपयोग कर सकते हैं।

अब जब हमने पंडों की कार्यक्षमता और टाइमस्टैम्प को पीरियड डेटा में बदलने के लिए रीसैंपल फ़ंक्शन का पता लगा लिया है, तो हम आसानी से समय के प्रति संवेदनशील डेटा को अधिक सार्थक तरीके से संभाल सकते हैं। इन उपकरणों की मदद से, डेवलपर्स, डेटा विश्लेषक और एसईओ विशेषज्ञ अपने डेटा से अद्वितीय अंतर्दृष्टि अनलॉक कर सकते हैं, जिससे उन्हें बेहतर निर्णय लेने और भविष्यवाणी करने में मदद मिलती है।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो