ઉકેલાયેલ: જન્મ તારીખ કૉલમને ઉંમરના પાંડામાં કન્વર્ટ કરો

આજના વિશ્વમાં, ડેટા વિશ્લેષણ વધુને વધુ મહત્વપૂર્ણ બન્યું છે, અને ડેટા વિશ્લેષકો અને ડેટા વૈજ્ઞાનિકો દ્વારા ઉપયોગમાં લેવાતા સૌથી લોકપ્રિય સાધનોમાંનું એક પાયથોન વિથ ધ પાન્ડાસ લાઇબ્રેરી છે. Pandas એ એક શક્તિશાળી, ઓપન-સોર્સ ડેટા વિશ્લેષણ અને મેનીપ્યુલેશન ટૂલ છે જે ડેટા સ્ટ્રક્ચર્સ અને સીરીઝમાં સરળ મેનીપ્યુલેશન માટે પરવાનગી આપે છે. વધુ સચોટ અને વ્યવહારુ પૃથ્થકરણ માટે જન્મતારીખને વયમાં રૂપાંતરિત કરવાની એક સામાન્ય સમસ્યા જે વપરાશકર્તાઓને આવે છે. આ લેખમાં, અમે કોડના અમલીકરણના સ્પષ્ટ ઉદાહરણો અને સમજૂતીઓ સાથે આ સમસ્યાને કેવી રીતે હલ કરવી તે વિશે જાણીશું.

Pandas એ એક બહુમુખી સાધન છે જેમાં ઘણીવાર DateTime ઑબ્જેક્ટ્સ સાથે કામ કરવાનો સમાવેશ થાય છે - જન્મ તારીખો સાથે કામ કરતી વખતે આ કેસ છે. જન્મતારીખને વયમાં રૂપાંતરિત કરવાના પ્રથમ પગલા માટે DateTime લાઇબ્રેરી સાથે સરળ અંકગણિતની જરૂર છે. આનાથી આપણે વ્યક્તિઓની જન્મતારીખ અને વર્તમાન તારીખ વચ્ચેના તફાવતની ગણતરી કરીને તેમની ઉંમર શોધી શકીશું.

ચાલો જરૂરી પુસ્તકાલયો આયાત કરીને પ્રારંભ કરીએ:

import pandas as pd
from datetime import datetime

આગળ, વ્યક્તિઓ વિશેનો નીચેનો ડેટા ધરાવતો સરળ ડેટાસેટ ધ્યાનમાં લો:

data = {'Name': ['John', 'Paul', 'George', 'Ringo'],
        'Birth_Date': ['1940-10-09', '1942-06-18', '1943-02-25', '1940-07-07']
       }

df = pd.DataFrame(data)
df['Birth_Date'] = pd.to_datetime(df['Birth_Date'])

ઉપરોક્ત કોડમાં, અમે 'Birth_date' કૉલમને DateTime ઑબ્જેક્ટમાં કન્વર્ટ કરી રહ્યાં છીએ.

ઉંમર ગણતરી

હવે, અમે આ વ્યક્તિઓની જન્મતારીખ અને વર્તમાન તારીખ વચ્ચેનો તફાવત શોધીને તેમની ઉંમરની ગણતરી કરવા તૈયાર છીએ. આ કરવા માટે, આ પગલાં અનુસરો:

1. 'calculate_age' નામનું ફંક્શન બનાવો જે ઇનપુટ તરીકે જન્મતારીખ લે છે અને વ્યક્તિની ઉંમર પરત કરે છે.
2. ડેટાફ્રેમમાં 'Birth_date' કૉલમમાં આ ફંક્શન લાગુ કરો.

ઉપરોક્ત તર્ક અમલમાં મૂકવા માટેનો કોડ અહીં છે:

def calculate_age(birth_date):
    today = datetime.now()
    age = today.year - birth_date.year - ((today.month, today.day) <
                                          (birth_date.month, birth_date.day))
    return age

df['Age'] = df['Birth_Date'].apply(calculate_age)

આ કોડ સ્નિપેટમાં, અમે 'calculate_age' નામનું ફંક્શન બનાવ્યું છે જે ઇનપુટ તરીકે જન્મ_તારીખ મેળવે છે, datetime.now() નો ઉપયોગ કરીને વર્તમાન તારીખની ગણતરી કરે છે, અને વર્તમાન વર્ષથી તેમના જન્મ વર્ષ બાદ કરીને વ્યક્તિની ઉંમરની ગણતરી કરે છે. જો તેમના આ વર્ષે જન્મતારીખ આવી નથી, અમે એક વધારાનું વર્ષ બાદ કરીએ છીએ.

છેલ્લે, અમે apply() પદ્ધતિનો ઉપયોગ કરીને 'Birth_date' કૉલમ પર આ ફંક્શન લાગુ કરીએ છીએ, અને ગણતરી કરેલ ઉંમર ડેટાફ્રેમમાં નવી 'ઉંમર' કૉલમમાં સંગ્રહિત થાય છે.

ઉંમરની ગણતરી માટે નમ્પી અને પાંડાનો ઉપયોગ કરવો

વૈકલ્પિક રીતે, અમે આ કાર્ય માટે પાંડા સાથે સંયોજનમાં શક્તિશાળી નમ્પી લાઇબ્રેરીનો ઉપયોગ કરી શકીએ છીએ. નમ્પીનો ઉપયોગ કરીને જન્મ તારીખોને વયમાં રૂપાંતરિત કરવા માટે, આ પગલાં અનુસરો:

1. નમ્પી લાઇબ્રેરી આયાત કરો.
2. ઉંમરની ગણતરી કરવા માટે નમ્પી 'ફ્લોર' ફંક્શનનો ઉપયોગ કરો.

આ કેવી રીતે કરવું તે અહીં એક ઉદાહરણ છે:

import numpy as np

df['Age'] = np.floor((datetime.now() - df['Birth_Date']).dt.days / 365.25)

આ કોડ ફ્લોટિંગ-પોઇન્ટ ડિવિઝન પરિણામને રાઉન્ડ ડાઉન કરવા માટે નમ્પીના 'ફ્લોર' ફંક્શનનો ઉપયોગ કરે છે. દિવસોની સંખ્યા જન્મ તારીખથી 365.25 (લીપ વર્ષોને ધ્યાનમાં લેતા).

સારાંશમાં, pandas અને datetime અથવા pandas and numpy જેવી લાઈબ્રેરીઓનો લાભ લઈને, તે ડેટાસેટની અંદર જન્મતારીખના કૉલમને વયમાં રૂપાંતરિત કરવા માટે સીમલેસ બની જાય છે. સમજાવેલા પગલાંને અનુસરીને અને આ લેખમાં આપેલા કોડને સમજવાથી તમને આવા ડેટાની હેરફેર કરવા અને વધુ કાર્યક્ષમ અને સચોટ વિશ્લેષણ હાથ ધરવા માટેનું જ્ઞાન મળશે.

સંબંધિત પોસ્ટ્સ:

પ્રતિક્રિયા આપો