Pandas என்பது தரவு கையாளுதல் மற்றும் பகுப்பாய்வுக்காக பரவலாகப் பயன்படுத்தப்படும் பைதான் நூலகமாகும் iloc முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தல் மூலம் தரவைத் தேர்ந்தெடுக்கவும் கையாளவும் பயனர்களை அனுமதிக்கும் நூலகத்தில் உள்ள ஒரு முக்கியமான செயல்பாடு ஆகும். பெரிய தரவுத்தொகுப்புகளுடன் பணிபுரியும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். இந்த கட்டுரையில், அதன் பயன்பாட்டை ஆராய்வோம் பாண்டாக்கள் iloc பல்வேறு சூழ்நிலைகளில் மற்றும் தரவு பகுப்பாய்வில் அதன் முக்கியத்துவம் மற்றும் சாத்தியமான பயன்பாடுகளைப் புரிந்துகொள்ள உதவும் வகையில், செயல்பாடு எவ்வாறு படிப்படியாகச் செயல்படுகிறது என்பதை விளக்குங்கள்.
pandas iloc: ஒரு பொதுவான பிரச்சனைக்கான தீர்வு
தரவு ஆய்வாளர்கள் எதிர்கொள்ளும் ஒரு பொதுவான சவால், அவர்களின் தரவுத்தொகுப்பின் குறிப்பிட்ட பகுதிகளை எவ்வாறு திறமையாகத் தேர்ந்தெடுத்து பகுப்பாய்வு செய்வது என்பது. பாண்டாக்களில் உள்ள டேட்டாஃப்ரேம் பொருள் இந்த சவால்களைச் சமாளிக்க பல சிறந்த முறைகளை வழங்குகிறது, மேலும் மிகவும் பல்துறை மற்றும் சக்திவாய்ந்த செயல்பாடுகளில் ஒன்று iloc குறியீட்டாளர். இது முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் DataFrame இன் வரிசைகள் மற்றும் நெடுவரிசைகளை அணுக பயனர்களுக்கு உதவுகிறது.
நடைமுறை தரவு பகுப்பாய்வு சூழ்நிலையில் iloc ஐ எவ்வாறு பயன்படுத்துவது என்பது பற்றிய படிப்படியான விளக்கத்தை விவாதிப்பதன் மூலம் தொடங்குவோம்.
Pandas iloc இன் படி-படி-படி விளக்கம்
பாண்டாஸ் ஐலோக்கைப் பயன்படுத்துவது எளிமையானது மற்றும் உள்ளுணர்வு. எங்களிடம் பின்வரும் DataFrame உள்ளது என்று வைத்துக்கொள்வோம்:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
எங்கள் DataFrame 4 வரிசைகள் மற்றும் 3 நெடுவரிசைகளைக் கொண்டுள்ளது. iloc ஐப் பயன்படுத்த, நீங்கள் அணுக விரும்பும் வரிசைகள் மற்றும் நெடுவரிசைகளுக்கான குறியீடுகளை வழங்க வேண்டும். இங்கே சில உதாரணங்கள்:
1. குறிப்பிட்ட வரிசை மற்றும் நெடுவரிசையை அணுகுதல்:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. வரிசைகள் மற்றும் நெடுவரிசைகளின் வரம்பை அணுகுதல்:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. குறிப்பிட்ட வரிசைகள் மற்றும் நெடுவரிசைகளை அணுகுதல்:
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
நூலகங்கள் மற்றும் சார்புநிலைகள்
உபயோகிக்க பாண்டாக்கள் iloc, நீங்கள் Pandas நூலகத்தை நிறுவியிருக்க வேண்டும், அதே போல் NumPy போன்ற பாண்டாக்கள் சார்ந்திருக்கும் வேறு எந்த நூலகங்களையும் நிறுவ வேண்டும். நீங்கள் அவற்றை பிப் அல்லது காண்டா வழியாக நிறுவலாம்:
pip install pandas numpy
or
conda install pandas numpy
நூலகங்கள் நிறுவப்பட்டதும், மேலே உள்ள எடுத்துக்காட்டுகளில் காட்டப்பட்டுள்ளபடி உங்கள் பைதான் சூழலில் பாண்டாக்கள் மற்றும் iloc ஐப் பயன்படுத்தத் தொடங்கலாம்.
பிற தொடர்புடைய செயல்பாடுகள் மற்றும் அட்டவணைப்படுத்தல் முறைகள்
கூடுதலாக iloc, பாண்டாஸ் பல்வேறு சூழ்நிலைகளில் பயனுள்ளதாக இருக்கும் பல அட்டவணையிடல் செயல்பாடுகள் மற்றும் முறைகளை வழங்குகிறது. அவற்றில் சில முக்கியமானவை:
- இடம்: iloc போன்ற முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலுக்குப் பதிலாக, லேபிள் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் வரிசைகள் மற்றும் நெடுவரிசைகளை அணுக இந்த அட்டவணை பயனர்களை அனுமதிக்கிறது.
- மணிக்கு: லேபிள் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் ஒற்றை மதிப்பை அணுக இது பயன்படுகிறது.
- iat: 'at' போன்றது, ஆனால் முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலுக்கு. முழு எண் அடிப்படையிலான அட்டவணைப்படுத்தலின் அடிப்படையில் ஒற்றை மதிப்பை அணுக இது பயன்படுகிறது.
இந்த செயல்பாடுகளை ஆராய்வது மற்றும் iloc உடன் இணைந்து அவற்றை எவ்வாறு பயன்படுத்தலாம் என்பதைப் புரிந்துகொள்வது, பாண்டாக்களைப் பயன்படுத்தி சிக்கலான தரவு கையாளுதல்களைச் செய்வதற்கான உங்கள் திறனை வலுப்படுத்தும்.