தீர்க்கப்பட்டது: காலமுத்திரைகளின் பாண்டாஸ் நெடுவரிசையை தேதிக்கு மாற்றவும்

தரவு பகுப்பாய்வு உலகில், நேர முத்திரைகள் கொண்ட தரவுத்தொகுப்புகளை சந்திப்பது பொதுவானது. சில சமயங்களில், போக்குகள் பகுப்பாய்வு, முன்கணிப்பு அல்லது காட்சிப்படுத்தல் போன்ற பல்வேறு நோக்கங்களுக்காக பயனுள்ளதாக இருக்கும் தேதியை மட்டுமே நாங்கள் எளிதாக்க விரும்பலாம். இந்தக் கட்டுரையில், பைத்தானைப் பயன்படுத்தி ** பாண்டாஸ் நெடுவரிசை நேர முத்திரைகளை இன்றுவரை மாற்றுவது** எப்படி என்பதை நாங்கள் உங்களுக்குக் காண்பிப்போம், இது உங்கள் தரவுடன் வேலை செய்வதையும் புரிந்துகொள்வதையும் எளிதாக்குகிறது. ஒரு தீர்வை நாங்கள் உங்களுக்கு வழங்குவோம், குறியீட்டின் படிப்படியான விளக்கத்தை வழங்குவோம், மேலும் உங்கள் தரவு கையாளுதல் திறன்களுக்கு மேலும் பயனளிக்கும் சில தொடர்புடைய நூலகங்கள் மற்றும் செயல்பாடுகளை ஆராய்வோம்.

பாண்டாஸில் நேர முத்திரைகளை தேதியாக மாற்றுகிறது

தொடங்குவதற்கு, உங்களிடம் இருக்க வேண்டும் பாண்டாக்கள் உங்கள் பைதான் சூழலில் நிறுவப்பட்டது. பாண்டாஸ் என்பது தரவு கையாளுதல் மற்றும் பகுப்பாய்வு கருவிகளை வழங்கும் சக்திவாய்ந்த நூலகம் ஆகும். பாண்டாஸில் உள்ள மிக முக்கியமான பொருட்களில் ஒன்று டேட்டாஃப்ரேம் ஆகும், இது பல்வேறு செயல்பாடுகளுடன் பெரிய அளவிலான தரவை எளிதாக நிர்வகிக்கவும் பகுப்பாய்வு செய்யவும் உங்களை அனுமதிக்கிறது.

நேர முத்திரைகளின் பாண்டாஸ் நெடுவரிசையை தேதியாக மாற்றுவதற்கான தீர்வு `dt` அணுகல் மற்றும் `தேதி` பண்புக்கூறைப் பயன்படுத்துகிறது. உங்களிடம் ஏற்கனவே நேரமுத்திரைகளின் நெடுவரிசையுடன் ஒரு DataFrame உள்ளது என வைத்துக்கொள்வோம். மாற்றத்திற்கான குறியீடு இப்படி இருக்கும்:

import pandas as pd

# Assuming your DataFrame is named df and the column with timestamps is 'timestamp_col'
df['date_col'] = df['timestamp_col'].dt.date

மேலே உள்ள குறியீடு துணுக்கை DataFrame இல் 'date_col' என்ற பெயரில் ஒரு புதிய நெடுவரிசையை உருவாக்கி, அதற்கு 'timestamp_col' இன் தேதி பகுதியை ஒதுக்குகிறது.

குறியீட்டின் படி-படி-படி விளக்கம்

இப்போது, ​​குறியீட்டைப் பிரித்து, அதன் ஒவ்வொரு பகுதியும் என்ன செய்கிறது என்பதைப் புரிந்துகொள்வோம்.

1. முதலில், பொதுவான `pd` மாற்றுப் பெயரைப் பயன்படுத்தி பாண்டாஸ் நூலகத்தை இறக்குமதி செய்கிறோம்:

   import pandas as pd
   

2. அடுத்து, 'டைம்ஸ்டாம்ப்_கோல்' எனப்படும் நேர முத்திரைகள் கொண்ட நெடுவரிசையைக் கொண்ட DataFrame `df` உங்களிடம் ஏற்கனவே இருப்பதாகக் கருதுகிறோம். இந்த நேர முத்திரைகளின் தேதி பகுதியை மட்டும் கொண்டு புதிய நெடுவரிசையை உருவாக்க, நாங்கள் `dt` அணுகலைப் பயன்படுத்துகிறோம், அதைத் தொடர்ந்து `date` பண்புக்கூறு:

   df['date_col'] = df['timestamp_col'].dt.date
   

`ஆண்டு`, `மாதம்`, `நாள்` மற்றும் `தேதி` போன்ற பாண்டாஸ் தொடரின் தேதிநேர பண்புகளுக்கான அணுகலை `dt` அணுகல் வழங்குகிறது. எங்கள் விஷயத்தில், நேர முத்திரைகளின் தேதிப் பகுதியை வழங்கும் `தேதி` பண்புக்கூறைப் பயன்படுத்தினோம்.

அவ்வளவுதான்! இந்த எளிய குறியீட்டு வரிகள் மூலம், இன்றுவரை நேரமுத்திரைகளின் பாண்டாஸ் நெடுவரிசையை வெற்றிகரமாக மாற்றிவிட்டீர்கள்.

பாண்டாஸ் நூலகம் மற்றும் அதன் முக்கியத்துவம்

பாண்டாக்கள் பைத்தானில் தரவு கையாளுதல் மற்றும் பகுப்பாய்விற்கான பிரதானமான ஒரு திறந்த மூல நூலகமாகும். இது பலதரப்பட்ட செயல்பாடுகளை வழங்குகிறது, பயனர்கள் ஒரே கருவியில் தரவு அனைத்தையும் சுத்தம் செய்தல், மாற்றுதல் மற்றும் காட்சிப்படுத்துதல் ஆகியவற்றை சாத்தியமாக்குகிறது. பாண்டாஸில் உள்ள முதன்மையான பொருள்கள் டேட்டாஃப்ரேம் மற்றும் சீரிஸ் ஆகும், அவை பல்வேறு வகையான தரவுகளைக் கையாள வடிவமைக்கப்பட்டுள்ளன.

DataFrame ஆப்ஜெக்ட் என்பது எண்கள், சரங்கள், தேதிகள் மற்றும் பல போன்ற பல்வேறு தரவு வகைகளின் நெடுவரிசைகளைக் கொண்ட இரு பரிமாண அட்டவணையாகும். தரவைத் திறமையாக வினவுவதற்கும், மாற்றியமைப்பதற்கும், பகுப்பாய்வு செய்வதற்கும் இது பல்வேறு செயல்பாடுகளை வழங்குகிறது.

மறுபுறம், தொடர் பொருள் என்பது எந்த தரவு வகையையும் கையாளும் திறன் கொண்ட ஒரு பரிமாண லேபிளிடப்பட்ட வரிசையாகும். தொடர்கள் அடிப்படையில் DataFrame நெடுவரிசைகளுக்கான கட்டுமானத் தொகுதிகள்.

பாண்டாஸில் உள்ள பிற பயனுள்ள தரவு கையாளுதல் செயல்பாடுகள்

நேர முத்திரைகளை இன்றுவரை மாற்றுவதுடன், தரவு கையாளுதலுக்கான பல பயனுள்ள செயல்பாடுகளையும் பாண்டாஸ் வழங்குகிறது. இவற்றில் சில அடங்கும்:

1. வடிகட்டுதல்: உங்களிடம் பெரிய தரவுத்தொகுப்பு இருக்கும்போது, ​​சில நிபந்தனைகளின் அடிப்படையில் தரவை வடிகட்ட விரும்பும் சூழ்நிலைகள் இருக்கலாம். `loc[]`, `iloc[]` மற்றும் `query()` போன்ற தரவை வடிகட்டுவதற்கு Pandas பல முறைகளை வழங்குகிறது.

2. குழுவாக்கல்: `groupby()` செயல்பாடு ஒன்று அல்லது அதற்கு மேற்பட்ட நெடுவரிசைகள் மூலம் தரவைத் தொகுக்கவும், ஒருங்கிணைக்கவும் உங்களை அனுமதிக்கிறது, தரவை பகுப்பாய்வு செய்வதற்கும் சுருக்குவதற்கும் பயனுள்ள தீர்வுகளை வழங்குகிறது.

3. இணைத்தல் மற்றும் இணைத்தல்: பல டேட்டாஃப்ரேம்களை ஒன்றாக இணைப்பதற்கும் சேர்ப்பதற்கும் `ஒன்று()` மற்றும் `சேர்()` போன்ற உள்ளமைக்கப்பட்ட செயல்பாடுகளை பாண்டாஸ் கொண்டுள்ளது.

4. விடுபட்ட தரவைக் கையாளுதல்: நிஜ-உலக தரவுத்தொகுப்புகள் பெரும்பாலும் விடுபட்ட மதிப்புகளைக் கொண்டிருக்கின்றன, மேலும் இந்த நிகழ்வுகளைச் சமாளிக்க `fillna()`, `dropna()` மற்றும் `interpolate()` போன்ற பல நுட்பங்களை Pandas வழங்குகிறது.

Pandas வழங்கும் பரந்த அளவிலான செயல்பாடுகளைப் பயன்படுத்துவதன் மூலம், பல்வேறு தரவு கையாளுதல் பணிகளைச் சமாளிக்கவும், உங்கள் தரவுத்தொகுப்புகளில் இருந்து மதிப்புமிக்க நுண்ணறிவுகளைக் கண்டறியவும் நீங்கள் நன்கு தயாராக இருப்பீர்கள்.

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை