தீர்க்கப்பட்டது: பாண்டாஸ் ஐலோக் தலைப்பை உள்ளடக்கியது

Pandas என்பது தரவு கையாளுதல் மற்றும் பகுப்பாய்வுக்காக பரவலாகப் பயன்படுத்தப்படும் பைதான் நூலகமாகும் iloc முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தல் மூலம் தரவைத் தேர்ந்தெடுக்கவும் கையாளவும் பயனர்களை அனுமதிக்கும் நூலகத்தில் உள்ள ஒரு முக்கியமான செயல்பாடு ஆகும். பெரிய தரவுத்தொகுப்புகளுடன் பணிபுரியும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். இந்த கட்டுரையில், அதன் பயன்பாட்டை ஆராய்வோம் பாண்டாக்கள் iloc பல்வேறு சூழ்நிலைகளில் மற்றும் தரவு பகுப்பாய்வில் அதன் முக்கியத்துவம் மற்றும் சாத்தியமான பயன்பாடுகளைப் புரிந்துகொள்ள உதவும் வகையில், செயல்பாடு எவ்வாறு படிப்படியாகச் செயல்படுகிறது என்பதை விளக்குங்கள்.

pandas iloc: ஒரு பொதுவான பிரச்சனைக்கான தீர்வு

தரவு ஆய்வாளர்கள் எதிர்கொள்ளும் ஒரு பொதுவான சவால், அவர்களின் தரவுத்தொகுப்பின் குறிப்பிட்ட பகுதிகளை எவ்வாறு திறமையாகத் தேர்ந்தெடுத்து பகுப்பாய்வு செய்வது என்பது. பாண்டாக்களில் உள்ள டேட்டாஃப்ரேம் பொருள் இந்த சவால்களைச் சமாளிக்க பல சிறந்த முறைகளை வழங்குகிறது, மேலும் மிகவும் பல்துறை மற்றும் சக்திவாய்ந்த செயல்பாடுகளில் ஒன்று iloc குறியீட்டாளர். இது முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் DataFrame இன் வரிசைகள் மற்றும் நெடுவரிசைகளை அணுக பயனர்களுக்கு உதவுகிறது.

நடைமுறை தரவு பகுப்பாய்வு சூழ்நிலையில் iloc ஐ எவ்வாறு பயன்படுத்துவது என்பது பற்றிய படிப்படியான விளக்கத்தை விவாதிப்பதன் மூலம் தொடங்குவோம்.

Pandas iloc இன் படி-படி-படி விளக்கம்

பாண்டாஸ் ஐலோக்கைப் பயன்படுத்துவது எளிமையானது மற்றும் உள்ளுணர்வு. எங்களிடம் பின்வரும் DataFrame உள்ளது என்று வைத்துக்கொள்வோம்:

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'],
        'Age': [25, 29, 21, 35],
        'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']}

df = pd.DataFrame(data)

எங்கள் DataFrame 4 வரிசைகள் மற்றும் 3 நெடுவரிசைகளைக் கொண்டுள்ளது. iloc ஐப் பயன்படுத்த, நீங்கள் அணுக விரும்பும் வரிசைகள் மற்றும் நெடுவரிசைகளுக்கான குறியீடுகளை வழங்க வேண்டும். இங்கே சில உதாரணங்கள்:

1. குறிப்பிட்ட வரிசை மற்றும் நெடுவரிசையை அணுகுதல்:

# Access row 2 (index 1) and column 'Name' (index 0)
selected_data = df.iloc[1, 0]
print(selected_data)  # Output: Bob

2. வரிசைகள் மற்றும் நெடுவரிசைகளின் வரம்பை அணுகுதல்:

# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1)
selected_data = df.iloc[0:2, 0:2]
print(selected_data)
# Output:
#     Name  Age
# 0  Alice   25
# 1    Bob   29

3. குறிப்பிட்ட வரிசைகள் மற்றும் நெடுவரிசைகளை அணுகுதல்:

# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2)
selected_data = df.iloc[[0, 3], [0, 2]]
print(selected_data)
# Output:
#     Name       City
# 0  Alice   New York
# 3  David     Boston

நூலகங்கள் மற்றும் சார்புநிலைகள்

உபயோகிக்க பாண்டாக்கள் iloc, நீங்கள் Pandas நூலகத்தை நிறுவியிருக்க வேண்டும், அதே போல் NumPy போன்ற பாண்டாக்கள் சார்ந்திருக்கும் வேறு எந்த நூலகங்களையும் நிறுவ வேண்டும். நீங்கள் அவற்றை பிப் அல்லது காண்டா வழியாக நிறுவலாம்:

pip install pandas numpy

or

conda install pandas numpy

நூலகங்கள் நிறுவப்பட்டதும், மேலே உள்ள எடுத்துக்காட்டுகளில் காட்டப்பட்டுள்ளபடி உங்கள் பைதான் சூழலில் பாண்டாக்கள் மற்றும் iloc ஐப் பயன்படுத்தத் தொடங்கலாம்.

பிற தொடர்புடைய செயல்பாடுகள் மற்றும் அட்டவணைப்படுத்தல் முறைகள்

கூடுதலாக iloc, பாண்டாஸ் பல்வேறு சூழ்நிலைகளில் பயனுள்ளதாக இருக்கும் பல அட்டவணையிடல் செயல்பாடுகள் மற்றும் முறைகளை வழங்குகிறது. அவற்றில் சில முக்கியமானவை:

  • இடம்: iloc போன்ற முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலுக்குப் பதிலாக, லேபிள் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் வரிசைகள் மற்றும் நெடுவரிசைகளை அணுக இந்த அட்டவணை பயனர்களை அனுமதிக்கிறது.
  • மணிக்கு: லேபிள் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் ஒற்றை மதிப்பை அணுக இது பயன்படுகிறது.
  • iat: 'at' போன்றது, ஆனால் முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலுக்கு. முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் ஒற்றை மதிப்பை அணுக இது பயன்படுகிறது.

இந்த செயல்பாடுகளை ஆராய்வது மற்றும் iloc உடன் இணைந்து அவற்றை எவ்வாறு பயன்படுத்தலாம் என்பதைப் புரிந்துகொள்வது, பாண்டாக்களைப் பயன்படுத்தி சிக்கலான தரவு கையாளுதல்களைச் செய்வதற்கான உங்கள் திறனை வலுப்படுத்தும்.

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை