தீர்க்கப்பட்டது: தேதி dtypes ஐ பொருளில் இருந்து ns%2CUTC ஆக பாண்டாக்களுடன் மாற்ற

பைத்தானுடன் பணிபுரியும் போது தரவு கையாளுதல் மற்றும் பகுப்பாய்வு உலகில் பாண்டாஸ் ஒரு இன்றியமையாத கருவியாகும். அதன் நெகிழ்வுத்தன்மை மற்றும் பயன்பாட்டின் எளிமை ஆகியவை தரவைக் கையாளுதல் மற்றும் பகுப்பாய்வு செய்வது தொடர்பான பரந்த அளவிலான பணிகளுக்கு ஏற்றதாக அமைகிறது. Pandas உடன் பணிபுரியும் போது எதிர்கொள்ளும் ஒரு பொதுவான பிரச்சனை, UTC நேர மண்டலத்துடன் தேதி dtypes ஐ Object இலிருந்து ns ஆக மாற்றுவது. சில தரவுத்தொகுப்புகளில், தேதி நெடுவரிசைகள் இயல்புநிலையாக தேதி dtypes ஆக அங்கீகரிக்கப்படாமல், அதற்குப் பதிலாகப் பொருள்களாகக் கருதப்படுவதால், இந்த மாற்றம் அவசியம். வரிசைப்படுத்துதல், வடிகட்டுதல் மற்றும் ஒன்றிணைத்தல் போன்ற செயல்பாடுகளைச் செய்ய முயற்சிக்கும்போது இது சிக்கல்களை ஏற்படுத்தும். இந்தக் கட்டுரையில், இந்தக் குறிப்பிட்ட சிக்கலை ஆராய்ந்து, குறியீட்டைப் புரிந்துகொள்வதற்கான படிப்படியான செயல்முறையை உள்ளடக்கி, பாண்டாஸைப் பயன்படுத்தி, தேதி நெடுவரிசைகளின் dtype ஐ Object இலிருந்து ns (UTC)க்கு எளிதாக மாற்றுவதற்கான தீர்வை வழங்குவோம்.

பாண்டாக்களின் அறிமுகம் மற்றும் தேதிகளுடன் வேலை செய்தல்

Pandas என்பது ஒரு திறந்த மூல நூலகமாகும், இது தரவுகளை எளிதாக மாற்றவும், கையாளவும் மற்றும் பகுப்பாய்வு செய்யவும் அனுமதிக்கிறது. இது DataFrame மற்றும் Series போன்ற தரவு கட்டமைப்புகளை வழங்குகிறது, இது Python இல் தரவுகளுடன் பணிபுரிவதை மிகவும் திறமையாகவும் உள்ளுணர்வுடனும் செய்கிறது. நேரத் தொடர் தரவைக் கையாளும் போது, ​​தேதிகள், நேரங்கள் மற்றும் நேர அட்டவணையிடப்பட்ட தரவுகளுடன் பணிபுரிய வடிவமைக்கப்பட்ட பல்வேறு செயல்பாடுகளுடன் Pandas வருகிறது.

இருப்பினும், CSV அல்லது Excel கோப்புகள் போன்ற பல்வேறு ஆதாரங்களில் இருந்து இந்த வகையான தரவை இறக்குமதி செய்யும் போது, ​​Pandas எப்போதும் தேதி நெடுவரிசைகளை சரியாக அடையாளம் காண முடியாது. இதன் விளைவாக தேதிகள் பொருள்களாகக் கருதப்படுகின்றன, அவற்றின் செயல்பாட்டைக் கட்டுப்படுத்துகிறது மற்றும் மேலும் தேதி தொடர்பான கணக்கீடுகள் மற்றும் செயல்பாடுகளுக்கு அவை பொருந்தாது.

தீர்வு: தேதி dtypes ஐ பொருளில் இருந்து ns (UTC) ஆக பாண்டாக்களுடன் மாற்றுதல்

இந்தச் சிக்கலுக்கான தீர்வு, பாண்டாஸைப் பயன்படுத்தி தேதி நெடுவரிசைகளை ஆப்ஜெக்டில் இருந்து விரும்பிய தேதிநேர வடிவமைப்பிற்கு (இந்த நிலையில், UTC நேர மண்டலத்துடன் ns) வெளிப்படையாக மாற்றுவதாகும். மூலம் இதை அடைய முடியும் pd.to_datetime() செயல்பாடு, இது தேதி நெடுவரிசைகளை எளிதாக மாற்ற அனுமதிக்கிறது.

import pandas as pd

# Load the CSV file
data = pd.read_csv('data.csv')

# Convert the date column from Object to ns (UTC)
data['date_column'] = pd.to_datetime(data['date_column'], utc=True, format='%Y-%m-%d')

# Print the DataFrame with the updated dtype for the date column
print(data.dtypes)

குறியீட்டின் படி-படி-படி விளக்கம்

  • மாற்றுப்பெயருடன் பாண்டாஸ் நூலகத்தை இறக்குமதி செய் pd.
  • உடன் தரவைக் கொண்ட CSV கோப்பை ஏற்றவும் pd.read_csv() செயல்பாடு.
  • பயன்படுத்தி தேதி நெடுவரிசையை மாற்றவும் pd.to_datetime() செயல்பாடு, விரும்பிய நேரமண்டலம் (utc=True) மற்றும் வடிவமைப்பு (தேவைப்பட்டால்) ஆகியவற்றுடன் ஆர்வத்தின் நெடுவரிசையை அனுப்புகிறது.
  • தேதி நெடுவரிசையானது பொருளில் இருந்து ns (UTC)க்கு வெற்றிகரமாக மாற்றப்பட்டதை உறுதிப்படுத்த DataFrame dtypes ஐ அச்சிடவும்.

கூடுதல் உதவிக்குறிப்புகள் மற்றும் சிறந்த நடைமுறைகள்

தேதிகள் மற்றும் நேரங்களைக் கையாளுவதற்கு Pandas பல முறைகள் மற்றும் செயல்பாடுகளை வழங்குகிறது. தேதி நெடுவரிசைகளைக் கையாளும் போது பின்பற்ற வேண்டிய சில கூடுதல் உதவிக்குறிப்புகள் மற்றும் சிறந்த நடைமுறைகள்:

  • தரவுத்தொகுப்பை இறக்குமதி செய்த பிறகு, உங்கள் நெடுவரிசைகளின் dtypes சரியான வடிவத்தில் இருப்பதை உறுதிசெய்ய எப்போதும் அவற்றைச் சரிபார்க்கவும்.
  • நேர மண்டலங்களுடன் பணிபுரிந்தால், இதைப் பயன்படுத்தவும் பிட்ஸ் மேலும் மேம்பட்ட நேர மண்டல மேலாண்மை விருப்பங்களுக்கான நூலகம்.
  • வழக்கமான பயன்பாட்டு நிகழ்வுகளுக்கு, தேதி நெடுவரிசையின் dtype ஐ நானோ விநாடிகளுக்கு (ns) மாற்ற வேண்டிய அவசியமில்லை. பாண்டாஸ் பயன்படுத்தும் இயல்புநிலை dtype (datetime64[ns]) பெரும்பாலும் போதுமானது.

இந்த வழிகாட்டியைப் பின்பற்றி, பாண்டாஸைப் பயன்படுத்தி தேதி dtypes ஐ Object இலிருந்து ns (UTC) க்கு மாற்றும் செயல்முறையைப் புரிந்துகொள்வதன் மூலம், உங்கள் நேரத் தொடர் தரவு சரியாக வடிவமைக்கப்பட்டு மேலும் கையாளுதல் மற்றும் பகுப்பாய்விற்குத் தயாராக இருப்பதை உறுதிசெய்யலாம். இது தரவு முன் செயலாக்க கட்டத்தை எளிதாக்குவது மட்டுமல்லாமல், மிகவும் துல்லியமான மற்றும் திறமையான பகுப்பாய்விற்கும் அனுமதிக்கிறது. இந்த நுட்பங்களில் உறுதியான புரிதலுடன், உங்கள் எதிர்கால திட்டங்களில் நேரத் தொடர் தரவைச் சமாளிக்க நீங்கள் நன்கு தயாராக இருப்பீர்கள்.

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை