தீர்க்கப்பட்டது: விடுபட்ட மதிப்புகள் பாண்டாக்களுக்குப் பதிலாக டிக்டைப் பயன்படுத்தவும்

தரவு கையாளுதல் மற்றும் பகுப்பாய்வு உலகில், காணாமல் போன மதிப்புகளைக் கையாள்வது ஒரு முக்கியமான பணியாகும். பாண்டாக்கள், பரவலாகப் பயன்படுத்தப்படும் பைதான் நூலகம், விடுபட்ட தரவைத் திறமையாக நிர்வகிக்க அனுமதிக்கிறது. காணாமல் போன மதிப்புகளைக் கையாள்வதற்கான ஒரு பொதுவான அணுகுமுறை, இந்த மதிப்புகளை வரைபடமாக்குவதற்கும் மாற்றுவதற்கும் அகராதிகளைப் பயன்படுத்துகிறது. இந்தக் கட்டுரையில், தரவுத்தொகுப்பில் காணாமல் போன மதிப்புகளை மாற்றுவதற்கு அகராதிகளைப் பயன்படுத்த, பாண்டாஸ் மற்றும் பைத்தானின் ஆற்றலை எவ்வாறு பயன்படுத்துவது என்பதைப் பற்றி விவாதிப்போம்.

தீர்வு

நாம் ஆராய்வோம் முதன்மையான தீர்வு ஃபில்னா() அகராதிகளுடன் இணைந்து செயல்படுகிறது. இந்த அணுகுமுறையானது விடுபட்ட மதிப்புகளை குறிப்பிட்ட அகராதியிலிருந்து தொடர்புடைய மதிப்புகளுடன் மாற்ற உதவும்.

குறியீட்டின் படிப்படியான விளக்கம்

இந்த செயல்முறையை விளக்குவதற்கு, ஆடைகள், வண்ணங்கள் மற்றும் வரலாற்று சூழல் உட்பட பல்வேறு ஃபேஷன் பாணிகள் பற்றிய தகவல்களைக் கொண்ட தரவுத்தொகுப்பு எங்களிடம் உள்ளது என்று வைத்துக்கொள்வோம். சில சந்தர்ப்பங்களில், இந்தத் தரவுத்தொகுப்பில் மதிப்புகள் விடுபட்டிருக்கலாம்.

முதலில், தேவையான நூலகங்களை இறக்குமதி செய்து, மாதிரி DataFrame ஐ உருவாக்கவும்:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

இப்போது சிக்கலை விளக்கும் DataFrame உள்ளது, சில மதிப்புகள் விடுபட்டிருப்பதைக் கவனிக்கவும் (எதுவும் இல்லை என குறிப்பிடப்படுகிறது). இந்த மதிப்புகளை மாற்ற, பொருத்தமான வரைபடங்களைக் கொண்ட அகராதிகளை உருவாக்கவும்:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

இறுதியாக, பயன்படுத்தவும் ஃபில்னா() ஒருங்கிணைந்த அகராதியைப் பயன்படுத்தி விடுபட்ட மதிப்புகளை மாற்றுவதற்கான செயல்பாடு:

df_filled = df.fillna(replacement_dict)

பாண்டாஸ் நூலகத்தைப் புரிந்துகொள்வது

பாண்டாக்கள் பைத்தானில் உள்ள பல்துறை நூலகமாகும், இது தரவு கையாளுதல் மற்றும் பகுப்பாய்வுக்காக வடிவமைக்கப்பட்டுள்ளது. இது தொடர் மற்றும் DataFrame போன்ற நெகிழ்வான மற்றும் சக்திவாய்ந்த தரவு கட்டமைப்புகளை வழங்குகிறது. கட்டமைக்கப்பட்ட, அட்டவணை தரவுகளுடன் திறமையாக வேலை செய்வதற்கு இந்த கட்டமைப்புகள் அவசியம்.

போன்ற செயல்பாடுகளின் வளமான தொகுப்பை பாண்டாஸ் வழங்குகிறது ஃபில்னா(), விடுபட்ட தரவைக் கையாளப் பயன்படுகிறது. தரவுகளை இணைத்தல், சுழலும் தரவு மற்றும் நேரத் தொடர் பகுப்பாய்வு போன்ற பிற செயல்பாடுகளை பாண்டாக்களுடன் தடையின்றிச் செய்ய முடியும்.

விடுபட்ட தரவை கையாளும் செயல்பாடுகள்

கூடுதலாக ஃபில்னா() செயல்பாடு, காணாமல் போன தரவைக் கையாள்வதற்கான பல செயல்பாடுகள் மற்றும் முறைகளை பாண்டாஸ் வழங்குகிறது.

  • dropna(): விடுபட்ட தரவுகளுடன் வரிசைகள் அல்லது நெடுவரிசைகளை அகற்றவும்.
  • isna(): எந்த DataFrame அல்லது தொடர் கூறுகள் காணவில்லை அல்லது பூஜ்யமாக உள்ளன என்பதைத் தீர்மானிக்கவும்.
  • நோட்னா(): எந்த DataFrame அல்லது தொடர் கூறுகள் காணவில்லை அல்லது பூஜ்யமாக இல்லை என்பதைத் தீர்மானிக்கவும்.
  • இடைக்கணிப்பு(): நேரியல் இடைக்கணிப்பைப் பயன்படுத்தி விடுபட்ட மதிப்புகளை நிரப்பவும்.

இந்த முறைகள், உடன் ஃபில்னா(), பல்வேறு சூழல்களில் விடுபட்ட தரவைக் கையாள்வதற்கான கருவிகளின் விரிவான தொகுப்பை வழங்கவும்.

முடிவில், இந்த கட்டுரை எவ்வாறு பயன்படுத்துவது என்பதை விளக்கியுள்ளது dict என்று Pandas DataFrame இல் விடுபட்ட மதிப்புகளை மாற்றுவதற்கு. நாங்கள் பயன்படுத்திய முக்கிய செயல்பாடு, ஃபில்னா(), பாண்டாஸ் நூலகத்தில் உள்ள ஒரு சக்திவாய்ந்த கருவியாகும், இது காணாமல் போன தரவை திறமையாக கையாள அனுமதிக்கிறது. அகராதிகளைப் பயன்படுத்துவதன் மூலம், விடுபட்ட மதிப்புகளை பொருத்தமான மாற்றீடுகளுக்கு வரைபடமாக்கலாம் மற்றும் எங்கள் தரவுத்தொகுப்பு முழுமையானதாகவும் அர்த்தமுள்ளதாகவும் இருப்பதை உறுதிசெய்யலாம். பாண்டாஸ் நூலகம் மற்றும் அதில் உள்ள செயல்பாடுகள் பற்றிய ஆழமான புரிதல் மூலம், பெரிய தரவுத்தொகுப்புகளுடன் திறம்பட செயல்படலாம் மற்றும் எங்கள் தரவிலிருந்து மதிப்புமிக்க நுண்ணறிவுகளைப் பெறலாம்.

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை