हल: जन्मतिथि कॉलम को आयु पांडा में बदलें

आज की दुनिया में, डेटा विश्लेषण तेजी से महत्वपूर्ण हो गया है, और डेटा विश्लेषकों और डेटा वैज्ञानिकों द्वारा उपयोग किए जाने वाले सबसे लोकप्रिय उपकरणों में से एक पांडा पुस्तकालय के साथ पायथन है। पांडा एक शक्तिशाली, ओपन-सोर्स डेटा विश्लेषण और हेरफेर उपकरण है जो डेटा संरचनाओं और श्रृंखलाओं के आसान हेरफेर की अनुमति देता है। एक आम समस्या जिसका सामना उपयोगकर्ता करते हैं वह अधिक सटीक और व्यावहारिक विश्लेषण के लिए जन्मतिथि को आयु में परिवर्तित करना है। इस लेख में, हम स्पष्ट उदाहरण और कोड कार्यान्वयन के स्पष्टीकरण के साथ इस मुद्दे से निपटने के तरीके पर ध्यान देंगे।

पंडों एक बहुमुखी उपकरण है जिसमें अक्सर डेटटाइम ऑब्जेक्ट्स के साथ काम करना शामिल होता है - यह मामला जन्म तिथियों से निपटने के दौरान होता है। जन्म तिथि को आयु में बदलने के पहले चरण के लिए डेटटाइम लाइब्रेरी के साथ सरल अंकगणित की आवश्यकता होती है। यह हमें व्यक्तियों की जन्म तिथि और वर्तमान तिथि के बीच के अंतर की गणना करके उनकी आयु का पता लगाने में सक्षम करेगा.

आइए आवश्यक पुस्तकालयों को आयात करके प्रारंभ करें:

import pandas as pd
from datetime import datetime

अगला, व्यक्तियों के बारे में निम्नलिखित डेटा वाले एक साधारण डेटासेट पर विचार करें:

data = {'Name': ['John', 'Paul', 'George', 'Ringo'],
        'Birth_Date': ['1940-10-09', '1942-06-18', '1943-02-25', '1940-07-07']
       }

df = pd.DataFrame(data)
df['Birth_Date'] = pd.to_datetime(df['Birth_Date'])

उपरोक्त कोड में, हम 'Birth_Date' कॉलम को डेटटाइम ऑब्जेक्ट में कनवर्ट कर रहे हैं।

आयु की गणना

अब, हम इन व्यक्तियों की जन्म तिथि और वर्तमान तिथि के बीच के अंतर का पता लगाकर उनकी आयु की गणना करने के लिए तैयार हैं। यह करने के लिए, इन उपायों का पालन करें:

1. 'कैलकुलेट_एज' नामक एक फ़ंक्शन बनाएं जो जन्मतिथि को इनपुट के रूप में लेता है और व्यक्ति की उम्र लौटाता है।
2. इस फ़ंक्शन को DataFrame में 'Birth_Date' कॉलम पर लागू करें।

उपरोक्त तर्क को लागू करने के लिए कोड यहां दिया गया है:

def calculate_age(birth_date):
    today = datetime.now()
    age = today.year - birth_date.year - ((today.month, today.day) <
                                          (birth_date.month, birth_date.day))
    return age

df['Age'] = df['Birth_Date'].apply(calculate_age)

इस कोड स्निपेट में, हमने 'कैलकुलेट_एज' नामक एक फ़ंक्शन बनाया है जो इनपुट के रूप में एक जन्म_तिथि प्राप्त करता है, datetime.now() का उपयोग करके वर्तमान तिथि की गणना करता है, और वर्तमान वर्ष से उनके जन्म वर्ष को घटाकर व्यक्ति की आयु की गणना करता है। यदि उनका इस साल जन्मतिथि नहीं आई है, हम एक अतिरिक्त वर्ष घटाते हैं।

अंत में, हम इस फ़ंक्शन को लागू () विधि का उपयोग करके 'Birth_Date' कॉलम पर लागू करते हैं, और परिकलित आयु को DataFrame में एक नए 'आयु' कॉलम में संग्रहीत किया जाता है।

आयु गणना के लिए Numpy और पांडा का उपयोग करना

वैकल्पिक रूप से, हम इस कार्य के लिए पांडा के साथ संयोजन में शक्तिशाली सुन्न पुस्तकालय का उपयोग कर सकते हैं। numpy का उपयोग करके जन्मतिथि को उम्र में बदलने के लिए, इन चरणों का पालन करें:

1. खस्ता पुस्तकालय आयात करें।
2. आयु की गणना करने के लिए सुन्न 'फ्लोर' फ़ंक्शन का उपयोग करें।

यह कैसे करना है इसका एक उदाहरण यहां दिया गया है:

import numpy as np

df['Age'] = np.floor((datetime.now() - df['Birth_Date']).dt.days / 365.25)

यह कोड फ़्लोटिंग-पॉइंट डिवीजन परिणाम को गोल करने के लिए numpy's 'floor' फ़ंक्शन का उपयोग करता है दिनों की संख्या जन्म तिथि से 365.25 तक (लीप वर्ष को ध्यान में रखते हुए)।

सारांश में, पांडा और डेटाइम या पांडा और सुन्न जैसे पुस्तकालयों का लाभ उठाकर, डेटासेट के भीतर जन्म तिथि कॉलम को उम्र में बदलना आसान हो जाता है। समझाए गए चरणों का पालन करना और इस आलेख में प्रदान किए गए कोड को समझना आपको इस तरह के डेटा में हेरफेर करने और अधिक कुशल और सटीक विश्लेषण करने के ज्ञान से लैस करेगा।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो