निराकरण: जन्मतारीख स्तंभ वयाच्या पांड्यात रूपांतरित करा

आजच्या जगात, डेटा विश्लेषण वाढत्या प्रमाणात महत्त्वाचे बनले आहे आणि डेटा विश्लेषक आणि डेटा वैज्ञानिकांद्वारे वापरले जाणारे सर्वात लोकप्रिय साधन म्हणजे पांडस लायब्ररीसह पायथन. Pandas एक शक्तिशाली, मुक्त-स्रोत डेटा विश्लेषण आणि हाताळणी साधन आहे जे डेटा संरचना आणि मालिका सहज हाताळू देते. वापरकर्त्यांना आढळणारी एक सामान्य समस्या म्हणजे अधिक अचूक आणि व्यावहारिक विश्लेषणासाठी जन्मतारीखांचे वयोगटात रूपांतर करणे. या लेखात, आम्ही कोडच्या अंमलबजावणीची स्पष्ट उदाहरणे आणि स्पष्टीकरणांसह या समस्येचा सामना कसा करायचा ते पाहू.

Pandas हे एक बहुमुखी साधन आहे ज्यामध्ये अनेकदा DateTime ऑब्जेक्ट्ससह काम करणे समाविष्ट असते – जन्मतारीख हाताळताना हीच परिस्थिती असते. जन्मतारीखांचे वयात रूपांतर करण्याच्या पहिल्या पायरीसाठी डेटटाइम लायब्ररीसह साधे अंकगणित आवश्यक आहे. हे आम्हाला व्यक्तींची जन्मतारीख आणि वर्तमान तारखेमधील फरक मोजून त्यांचे वय शोधण्यास सक्षम करेल.

चला आवश्यक लायब्ररी आयात करून प्रारंभ करूया:

import pandas as pd
from datetime import datetime

पुढे, व्यक्तींबद्दल खालील डेटा असलेल्या एका साध्या डेटासेटचा विचार करा:

data = {'Name': ['John', 'Paul', 'George', 'Ringo'],
        'Birth_Date': ['1940-10-09', '1942-06-18', '1943-02-25', '1940-07-07']
       }

df = pd.DataFrame(data)
df['Birth_Date'] = pd.to_datetime(df['Birth_Date'])

वरील कोडमध्ये, आम्ही 'Birth_date' स्तंभाला DateTime ऑब्जेक्ट्समध्ये रूपांतरित करत आहोत.

वय मोजत आहे

आता, आम्ही या व्यक्तींची जन्मतारीख आणि सध्याची तारीख यातील फरक शोधून त्यांच्या वयाची गणना करण्यास तयार आहोत. हे करण्यासाठी, या चरणांचे अनुसरण करा:

1. 'calculate_age' नावाचे फंक्शन तयार करा जे इनपुट म्हणून जन्मतारीख घेते आणि व्यक्तीचे वय परत करते.
2. हे फंक्शन डेटाफ्रेममधील 'Birth_date' कॉलममध्ये लागू करा.

वरील तर्क लागू करण्यासाठी हा कोड आहे:

def calculate_age(birth_date):
    today = datetime.now()
    age = today.year - birth_date.year - ((today.month, today.day) <
                                          (birth_date.month, birth_date.day))
    return age

df['Age'] = df['Birth_Date'].apply(calculate_age)

या कोड स्निपेटमध्ये, आम्ही 'calculate_age' नावाचे फंक्शन तयार केले आहे जे इनपुट म्हणून जन्म_तारीख प्राप्त करते, datetime.now() वापरून वर्तमान तारखेची गणना करते आणि चालू वर्षातून त्यांचे जन्म वर्ष वजा करून व्यक्तीचे वय काढते. जर त्यांच्या या वर्षी जन्मतारीख आली नाही, आम्ही अतिरिक्त वर्ष वजा करतो.

शेवटी, आम्ही हे फंक्शन 'Birth_date' कॉलमवर लागू() पद्धतीचा वापर करून लागू करतो, आणि गणना केलेले वयोगट डेटाफ्रेममधील नवीन 'वय' कॉलममध्ये संग्रहित केले जातात.

वय मोजण्यासाठी नम्पी आणि पांडा वापरणे

वैकल्पिकरित्या, आम्ही या कार्यासाठी पांडांच्या संयोजनात शक्तिशाली नम्पी लायब्ररी वापरू शकतो. numpy वापरून जन्मतारीख वयोगटात रूपांतरित करण्यासाठी, या चरणांचे अनुसरण करा:

1. numpy लायब्ररी आयात करा.
2. वय मोजण्यासाठी numpy 'floor' फंक्शन वापरा.

हे कसे करायचे याचे एक उदाहरण येथे आहे:

import numpy as np

df['Age'] = np.floor((datetime.now() - df['Birth_Date']).dt.days / 365.25)

हा कोड फ्लोटिंग-पॉइंट डिव्हिजन रिझल्ट खाली पूर्ण करण्यासाठी numpy च्या 'floor' फंक्शनचा वापर करतो दिवसांची संख्या जन्मतारीख ३६५.२५ (लीप वर्षे विचारात घेऊन) पासून.

सारांश, pandas आणि datetime किंवा pandas and numpy सारख्या लायब्ररींचा फायदा घेऊन, डेटासेटमध्ये जन्मतारीख स्तंभांचे वयात रूपांतर करणे अखंड होते. स्पष्ट केलेल्या चरणांचे अनुसरण केल्याने आणि या लेखात प्रदान केलेला कोड समजून घेतल्याने तुम्हाला अशा डेटामध्ये फेरफार करण्याचे आणि अधिक कार्यक्षम आणि अचूक विश्लेषण करण्याचे ज्ञान मिळेल.

संबंधित पोस्ट:

एक टिप्पणी द्या