தீர்க்கப்பட்டது: பாண்டாக்களில் அதிகபட்ச விலகல்

பிரபலமான பைதான் லைப்ரரி பாண்டாஸைப் பயன்படுத்தி தரவு பகுப்பாய்வு மற்றும் கையாளுதலுக்கு வரும்போது பாண்டாஸில் அதிகபட்ச விலகல் ஒரு சுவாரஸ்யமான தலைப்பு. தரவை பகுப்பாய்வு செய்வதன் முக்கிய அம்சங்களில் ஒன்று, தரவில் உள்ள மாறுபாட்டை அடையாளம் காண்பது, இது அதிகபட்ச விலகலைக் கணக்கிடுவதன் மூலம் செய்யப்படலாம். இந்த கட்டுரையில், பாண்டாஸில் அதிகபட்ச விலகலை எவ்வாறு கணக்கிடுவது, வெவ்வேறு அணுகுமுறைகளை ஆராய்வது மற்றும் இந்த சிக்கலைத் தீர்க்கப் பயன்படுத்தக்கூடிய சில தொடர்புடைய நூலகங்கள் மற்றும் செயல்பாடுகளை ஆழமாக ஆராய்வது எப்படி என்பதைக் கற்றுக்கொள்வோம்.

அதிகபட்ச விலகல் என்பது தரவுத்தொகுப்பில் உள்ள மதிப்புக்கும் அந்த தரவுத்தொகுப்பின் சராசரி அல்லது இடைநிலைக்கும் இடையிலான அதிகபட்ச வேறுபாட்டைக் குறிக்கிறது. புள்ளிவிபரங்களில், தரவுத்தொகுப்பில் உள்ள தரவுப் புள்ளிகளின் சிதறல் மற்றும் மாறுபாட்டைப் புரிந்துகொள்ள விலகல் உதவுகிறது. இது நிதி பகுப்பாய்வு, சமிக்ஞை செயலாக்கம் மற்றும் பிற அளவு துறைகளில் பெரும்பாலும் பயன்படுத்தப்படும் ஒரு முக்கியமான கருத்தாகும்.

பிரச்சனைக்கான தீர்வு

Pandas இல் அதிகபட்ச விலகலைக் கணக்கிட, தேவையான நூலகங்களை இறக்குமதி செய்து மாதிரி DataFrame ஐ உருவாக்குவதன் மூலம் தொடங்கலாம். பின்னர், தரவின் சராசரி அல்லது சராசரியைக் கணக்கிட்டு, ஒவ்வொரு தரவுப் புள்ளிக்கும் சராசரி/சராசரிக்கும் இடையிலான அதிகபட்ச தூரத்தைக் கண்டுபிடிப்போம். இறுதியாக, இந்த முழுமையான விலகல்களில் அதிகபட்ச மதிப்பைக் கண்டறிய அதிகபட்சம்() செயல்பாட்டைப் பயன்படுத்துவோம்.

Pandas DataFrame இல் அதிகபட்ச விலகலை எவ்வாறு கணக்கிடுவது என்பதை விளக்கும் எடுத்துக்காட்டு குறியீடு இங்கே:

import pandas as pd

# Sample data
data = {'Value': [5, 7, 11, 18, 23, 25, 29, 35, 40, 50]}
df = pd.DataFrame(data)

# Compute mean and median
mean = df['Value'].mean()
median = df['Value'].median()

# Calculate absolute deviations from mean and median
df['Mean Deviation'] = (df['Value'] - mean).abs()
df['Median Deviation'] = (df['Value'] - median).abs()

# Find max deviation
max_mean_deviation = df['Mean Deviation'].max()
max_median_deviation = df['Median Deviation'].max()

print("Max Deviation from Mean: ", max_mean_deviation)
print("Max Deviation from Median: ", max_median_deviation)

படிப்படியான விளக்கம்

இப்போது Pandas DataFrame இல் அதிகபட்ச விலகலைக் கணக்கிடும் செயல்முறையைப் புரிந்துகொள்ள, படிப்படியாக குறியீட்டைப் பார்ப்போம்:

1. முதலில், பாண்டாஸ் லைப்ரரியை இறக்குமதி செய்து, 'மதிப்பு' என்ற ஒற்றை நெடுவரிசையுடன் மாதிரி டேட்டாஃப்ரேமை உருவாக்குவோம்.

2. பின்னர் பாண்டாஸ் வழங்கிய சராசரி() மற்றும் மீடியன்() செயல்பாடுகளைப் பயன்படுத்தி தரவின் சராசரி மற்றும் இடைநிலையைக் கணக்கிடுகிறோம்.

3. அடுத்து, அந்தந்த தரவுப் புள்ளிகளிலிருந்து சராசரி மற்றும் இடைநிலையைக் கழிப்பதன் மூலம் ஒவ்வொரு தரவுப் புள்ளிக்கும் முழுமையான விலகல்களைக் கணக்கிட்டு, அதன் விளைவாக வரும் வேறுபாடுகளின் முழுமையான மதிப்பை எடுத்துக்கொள்வோம்.

4. இறுதியாக, முழுமையான விலகல்களில் அதிகபட்ச மதிப்பைக் கண்டறிய max() செயல்பாட்டைப் பயன்படுத்துகிறோம்.

5. வெளியீடு தரவுத்தொகுப்பின் சராசரி மற்றும் இடைநிலை இரண்டிலிருந்தும் அதிகபட்ச விலகலைக் காண்பிக்கும்.

தொடர்புடைய நூலகங்கள் மற்றும் செயல்பாடுகள்

  • பாண்டாக்கள்: இந்தக் கட்டுரையில் பயன்படுத்தப்படும் முதன்மை நூலகம் இதுவாகும், மேலும் அதன் சக்திவாய்ந்த தரவு கையாளுதல் திறன்களுக்காக இது பரவலாக அங்கீகரிக்கப்பட்டுள்ளது. சராசரி(), சராசரி(), அதிகபட்சம்(), min(), மற்றும் abs() போன்ற பொதுவாகப் பயன்படுத்தப்படும் செயல்பாடுகள் பாண்டாஸ் நூலகத்தின் ஒரு பகுதியாகும்.
  • NumPy: இது பைத்தானில் உள்ள மற்றொரு பிரபலமான எண் கணினி நூலகமாகும், இது வரிசைகள் மற்றும் எண் செயல்பாடுகளுடன் பணிபுரிய விரிவான ஆதரவை வழங்குகிறது. சில சமயங்களில், Pandas போன்ற பணிகளைச் செய்ய ஒருவர் NumPy செயல்பாடுகளைப் பயன்படுத்தலாம்.

முடிவில்

பாண்டாஸில் அதிகபட்ச விலகலைக் கண்டறிவது, தரவுப் பகுப்பாய்வின் ஒரு முக்கிய அம்சமாகும், இது தரவுத்தொகுப்பிற்குள் சிதறலை அளவிட உங்களை அனுமதிக்கிறது, மேலும் இந்தப் பணியைச் செய்வதற்கான நேரடியான அணுகுமுறையை இந்தக் கட்டுரை கோடிட்டுக் காட்டுகிறது. சராசரி(), மீடியன்(), ஏபிஎஸ்(), மற்றும் அதிகபட்சம்() போன்ற பாண்டாஸ் செயல்பாடுகளைப் பயன்படுத்துவதன் மூலம், கொடுக்கப்பட்ட எந்த தரவுத்தொகுப்பிற்கும் அதிகபட்ச விலகலைத் திறமையாகக் கணக்கிட முடியும். மேலும், NumPy போன்ற நூலகங்களைப் பயன்படுத்தி இதே போன்ற செயல்பாடுகள் மற்றும் செயல்பாடுகளை அடைய முடியும், இது டெவலப்பருக்குக் கிடைக்கும் தரவு கையாளுதல் நுட்பங்களின் நோக்கத்தை முழுமையாக்குகிறது மற்றும் விரிவுபடுத்துகிறது.

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை