सोडवले: पांडाच्या तारखेत महिन्यांत फरक

Pandas एक लोकप्रिय Python लायब्ररी आहे जी डेटा हाताळणी आणि विश्लेषण सुलभ करते, तारखा आणि वेळा हाताळण्यासाठी विस्तृत कार्ये ऑफर करते. डेटा विश्लेषणातील एक सामान्य वापर प्रकरण म्हणजे महिन्यांतील तारखांमधील फरक मोजणे. या लेखात, आम्ही कोडच्या चरण-दर-चरण स्पष्टीकरणासह, Pandas वापरून हे साध्य करण्यासाठी एक दृष्टिकोन शोधू. शिवाय, समस्येबद्दलची आमची समज वाढवण्यासाठी आम्ही काही इतर संबंधित लायब्ररी आणि फंक्शन्सची चर्चा करू.

डेटा विश्लेषक आणि विकासकांसाठी तारीख आणि वेळ डेटा हाताळणे नेहमीच एक आव्हान असते. Python's Pandas लायब्ररी तारखा, वेळा आणि वेळ डेल्टा हाताळण्यासाठी फंक्शन्सचा एक शक्तिशाली आणि बहुमुखी संच प्रदान करून हे कार्य अधिक सुलभ करते. या लेखात, आम्ही पांडा वापरून महिन्यांतील दोन तारखांमधील फरक कसा मोजायचा हे दाखवू.

समस्येचे निराकरण

import pandas as pd

def date_diff_in_months(date1, date2):
    return (date2.year - date1.year) * 12 + (date2.month - date1.month)

date1 = pd.to_datetime("2021-01-01")
date2 = pd.to_datetime("2022-05-01")

months_diff = date_diff_in_months(date1, date2)
print(months_diff)

संहितेचे स्पष्टीकरण

1. प्रथम, आम्ही Pandas लायब्ररी pd म्हणून आयात करतो. हे आम्हांला तारखांसोबत काम करण्यासाठी Pandas च्या मजबूत फंक्शन्सचा वापर करण्यास अनुमती देते.

2. त्यानंतर आम्ही `date_diff_in_months` नावाचे फंक्शन परिभाषित करतो जे दोन आर्ग्युमेंट घेते, `date1`, आणि `date2`. हे फंक्शन दोन इनपुट तारखांमधील महिन्यांची संख्या परत करेल.

3. फंक्शनच्या आत, आम्ही `date1` मधील संबंधित घटकांमधून `date2` चे वर्ष आणि महिन्याचे घटक वजा करून, त्यानंतर वर्षांतील फरकासाठी निकाल समायोजित करून महिन्यांतील फरक मोजतो.

4. पुढे, आम्ही `pd.to_datetime` फंक्शन वापरून, `date1` आणि `date2`, दोन Pandas Timestamp ऑब्जेक्ट्स तयार करतो. हे आमच्या चाचणी केससाठी दोन नमुना तारखा दर्शवतात.

5. आम्ही `date_diff_in_months` फंक्शनला `date1` आणि `date2` सह कॉल करतो, परिणाम `months_diff` व्हेरिएबलमध्ये संचयित करतो.

6. शेवटी, आम्ही `months_diff` व्हेरिएबल मुद्रित करतो, जे दोन इनपुट तारखांमधील महिन्यांची संख्या प्रदर्शित करेल.

पांडा आणि टाइमस्टॅम्प

पांडाच्या टाइमस्टॅम्प ऑब्जेक्ट्स आश्चर्यकारकपणे अष्टपैलू आहेत, अखंड डेटटाइम हाताळणी आणि तुलना करण्यास अनुमती देतात. `pd.to_datetime` फंक्शनला कॉल करून, आम्ही डेट फॉरमॅटची विस्तृत श्रेणी Pandas Timestamp ऑब्जेक्ट्समध्ये रूपांतरित करू शकतो. या वस्तूंची नंतर सहजपणे तुलना केली जाऊ शकते, हाताळले जाऊ शकते आणि जटिल गणना करण्यासाठी त्यांचा वापर केला जाऊ शकतो. आमच्या सोल्युशनमध्ये, आम्ही महिन्यांतील दोन तारखांमधील फरक मोजण्यासाठी टाइमस्टॅम्प ऑब्जेक्ट्सच्या शक्तीचा फायदा घेतो.

पर्यायी लायब्ररी आणि कार्ये

  • उबळ: तारखा आणि वेळेसह काम करण्यासाठी आणखी एक लोकप्रिय Python लायब्ररी म्हणजे Numpy. त्याच्या `numpy.datetime64` ऑब्जेक्ट्ससह, Numpy पांडाच्या टाइमस्टॅम्प ऑब्जेक्ट्सशी तुलनात्मक कार्यक्षमता ऑफर करते. Numpy तारखांमधील फरकांची गणना करण्यासाठी `numpy.timedelta64` सारखी कार्ये देखील प्रदान करते.
  • dateutil: dateutil लायब्ररी हे Python मध्ये तारखांचे विश्लेषण आणि फेरफार करण्यासाठी एक शक्तिशाली साधन आहे. हे `dateutil.relativedelta.relativedelta` फंक्शनसह तारीख अंकगणित हाताळण्यासाठी फंक्शन्स आणि क्लासेसचा विस्तृत संच प्रदान करते, जे विशेषतः वर्ष, महिने आणि दिवसांच्या संदर्भात तारखांमधील फरकांची गणना करण्यासाठी उपयुक्त आहे.

सारांश, Pandas वापरून महिन्यांतील दोन तारखांमधील फरक मोजणे एका सोप्या परंतु प्रभावी पद्धतीद्वारे प्राप्त केले जाऊ शकते. हे कार्य सहजतेने करण्यासाठी आम्ही पांडस टाइमस्टॅम्प ऑब्जेक्ट्स आणि कस्टम फंक्शनवर अवलंबून राहू शकतो. शिवाय, Numpy आणि dateutil सारख्या पर्यायी लायब्ररी डेटटाइम-संबंधित समस्यांच्या विस्तृत श्रेणीला सामोरे जाण्यासाठी पर्यायी दृष्टिकोन देतात.

संबंधित पोस्ट:

एक टिप्पणी द्या