हल किया गया: टाइमस्टैम्प के एक पांडा कॉलम को तिथि में बदलें

डेटा विश्लेषण की दुनिया में, टाइमस्टैम्प वाले डेटासेट का सामना करना आम बात है। कभी-कभी, हम सरल बनाना चाहते हैं और केवल तारीख पर विचार कर सकते हैं, जो प्रवृत्ति विश्लेषण, पूर्वानुमान या विज़ुअलाइज़ेशन जैसे विभिन्न उद्देश्यों के लिए उपयोगी हो सकता है। इस लेख में, हम आपको दिखाएंगे कि पायथन का उपयोग करके **टाइमस्टैम्प के पांडा कॉलम को दिनांक में कैसे बदलें**, जिससे आपके लिए अपने डेटा के साथ काम करना और समझना आसान हो जाता है। हम आपको एक समाधान के माध्यम से चलेंगे, कोड की चरण-दर-चरण व्याख्या प्रदान करेंगे, साथ ही कुछ संबंधित पुस्तकालयों और कार्यों में तल्लीन करेंगे जो आपके डेटा हेरफेर कौशल को और लाभ पहुंचा सकते हैं।

पंडों में टाइमस्टैम्प को तिथि में परिवर्तित करना

आरंभ करने के लिए, आपके पास होना चाहिए पांडा आपके पायथन वातावरण में स्थापित। पांडा एक शक्तिशाली पुस्तकालय है जो डेटा हेरफेर और विश्लेषण उपकरण प्रदान करता है। पंडों में सबसे महत्वपूर्ण वस्तुओं में से एक डेटाफ़्रेम है, जो आपको विभिन्न प्रकार के कार्यों के साथ बड़ी मात्रा में डेटा को आसानी से प्रबंधित और विश्लेषण करने की अनुमति देता है।

टाइमस्टैम्प के पंडों के कॉलम को डेट में बदलने का समाधान `डीटी` एक्सेसर और `डेट` विशेषता का उपयोग करने पर जोर देता है। आइए मान लें कि आपके पास टाइमस्टैम्प के कॉलम के साथ पहले से ही डेटाफ्रेम है। रूपांतरण करने के लिए कोड इस तरह दिखेगा:

import pandas as pd

# Assuming your DataFrame is named df and the column with timestamps is 'timestamp_col'
df['date_col'] = df['timestamp_col'].dt.date

उपरोक्त कोड स्निपेट डेटाफ़्रेम में 'date_col' नामक एक नया कॉलम बनाता है, और इसे 'timestamp_col' का दिनांक भाग असाइन करता है।

कोड की चरण-दर-चरण व्याख्या

अब, कोड का विश्लेषण करते हैं और समझते हैं कि इसका प्रत्येक भाग क्या करता है।

1. सबसे पहले, हम सामान्य `पीडी` उपनाम का उपयोग करके पंडों के पुस्तकालय का आयात करते हैं:

   import pandas as pd
   

2. अगला, हम मानते हैं कि आपके पास पहले से ही एक डेटाफ़्रेम `df` है जिसमें टाइमस्टैम्प वाला एक कॉलम है जिसे 'timestamp_col' कहा जाता है। इन टाइमस्टैम्प के केवल दिनांक भाग के साथ एक नया कॉलम बनाने के लिए, हम `dt` एक्सेसर का उपयोग करते हैं जिसके बाद `date` विशेषता होती है:

   df['date_col'] = df['timestamp_col'].dt.date
   

`डीटी` एक्सेसर पंडों की श्रृंखला के डेटाटाइम गुणों तक पहुंच प्रदान करता है, जैसे `वर्ष`, `महीना`, `दिन` और `तारीख`। हमारे मामले में, हमने `तारीख` विशेषता का उपयोग किया जो टाइमस्टैम्प का दिनांक भाग लौटाता है।

और बस! कोड की इन सरल पंक्तियों के साथ, आपने टाइमस्टैम्प के पांडा कॉलम को सफलतापूर्वक आज तक बदल दिया है।

पंडों का पुस्तकालय और इसका महत्व

पांडा एक ओपन-सोर्स लाइब्रेरी है जो पायथन में डेटा हेरफेर और विश्लेषण के लिए एक प्रधान बन गया है। यह कार्यक्षमता की एक विस्तृत श्रृंखला प्रदान करता है, जिससे उपयोगकर्ताओं के लिए एक ही उपकरण के भीतर डेटा को साफ करना, रूपांतरित करना और कल्पना करना संभव हो जाता है। पंडों में प्राथमिक वस्तुएँ डेटाफ़्रेम और श्रृंखला हैं, जिन्हें विभिन्न प्रकार के डेटा को संभालने के लिए डिज़ाइन किया गया है।

DataFrame ऑब्जेक्ट एक द्वि-आयामी तालिका है जिसमें विभिन्न डेटा प्रकारों के कॉलम हो सकते हैं, जैसे संख्याएँ, तार, दिनांक और बहुत कुछ। यह कुशलता से क्वेरी करने, संशोधित करने और डेटा का विश्लेषण करने के लिए विभिन्न कार्य प्रदान करता है।

दूसरी ओर, श्रृंखला वस्तु, एक आयामी लेबल वाली सरणी है जो किसी भी डेटा प्रकार को संभालने में सक्षम है। श्रृंखला अनिवार्य रूप से डेटाफ़्रेम कॉलम के लिए बिल्डिंग ब्लॉक्स हैं।

पांडा में अन्य उपयोगी डेटा हेरफेर कार्य

टाइमस्टैम्प को तिथि में बदलने के अलावा, पांडा डेटा हेरफेर के लिए कई अन्य उपयोगी कार्य भी प्रदान करता है। इनमें से कुछ में शामिल हैं:

1. छनन: जब आपके पास एक बड़ा डेटासेट होता है, तो ऐसे परिदृश्य हो सकते हैं जहाँ आप कुछ शर्तों के आधार पर डेटा को फ़िल्टर करना चाहेंगे। पांडा डेटा को फ़िल्टर करने के लिए कई तरीके प्रदान करता है, जैसे `लोक []`, `आईलोक []`, और `क्वेरी ()`।

2. समूहीकरण: `GroupBy ()` फ़ंक्शन आपको डेटा का विश्लेषण और सारांश करने के लिए प्रभावी समाधान प्रदान करते हुए, एक या अधिक कॉलम द्वारा डेटा को समूहीकृत और एकत्र करने की अनुमति देता है।

3. विलय और शामिल होना: पंडों के अंतर्निहित कार्य हैं, जैसे `मर्ज ()` और `जॉइन ()`, मर्ज करने और एक साथ कई डेटाफ़्रेम में शामिल होने के लिए।

4. लापता डेटा को संभालना: वास्तविक दुनिया के डेटासेट में अक्सर लापता मान होते हैं, और पांडा इन उदाहरणों से निपटने के लिए कई तकनीकें प्रदान करता है, जैसे `फिलना (), `ड्रॉपना ()`, और `इंटरपोलेट ()`।

पंडों द्वारा प्रदान किए गए कार्यों की विस्तृत श्रृंखला का उपयोग करके, आप विभिन्न डेटा हेरफेर कार्यों से निपटने और अपने डेटासेट से मूल्यवान अंतर्दृष्टि को उजागर करने के लिए अच्छी तरह से सुसज्जित होंगे।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो