தீர்க்கப்பட்டது: பாண்டாக்கள் இல்லை என்றால் டேட்டாஃப்ரேமில் பல நெடுவரிசைகளைச் சேர்க்கவும்

Pandas என்பது ஒரு திறந்த மூல பைதான் நூலகமாகும், இது உயர் செயல்திறன், பயன்படுத்த எளிதான தரவு கட்டமைப்புகள் மற்றும் தரவு பகுப்பாய்வு கருவிகளை வழங்குகிறது. தரவு கையாளுதல் மற்றும் பகுப்பாய்விற்கு வரும்போது டெவலப்பர்கள் மற்றும் தரவு விஞ்ஞானிகளுக்கு இது ஒரு விருப்பமாக மாறியுள்ளது. பாண்டாஸ் வழங்கும் சக்திவாய்ந்த அம்சங்களில் ஒன்று டேட்டாஃப்ரேம்களை உருவாக்குவதும் மாற்றியமைப்பதும் ஆகும். இந்தக் கட்டுரையில், பாண்டாஸ் நூலகத்தைப் பயன்படுத்தி, டேட்டாஃப்ரேமில் பல நெடுவரிசைகளைச் சேர்க்கும் செயல்முறையை ஆராய்வோம். குறியீட்டின் படிப்படியான விளக்கத்தை நாங்கள் மேற்கொள்வோம் மற்றும் தொடர்புடைய செயல்பாடுகள், நூலகங்கள் மற்றும் வழியில் நீங்கள் சந்திக்கும் சிக்கல்களில் மூழ்குவோம்.

டேட்டாஃப்ரேம்களுடன் பணிபுரிவது டேட்டாவை கையாளும் போது முக்கியமானது, மேலும் டேட்டாஃப்ரேமில் ஒரே நேரத்தில் பல நெடுவரிசைகளைச் சேர்க்க வேண்டிய சூழ்நிலையில் நீங்கள் உங்களைக் காணலாம். இது தந்திரமானதாக இருக்கலாம், ஆனால் பாண்டாஸ் நூலகம் இந்த பணியை மென்மையாகவும் திறமையாகவும் செய்கிறது. முதலில், பாண்டாஸ் நூலகத்தை இறக்குமதி செய்வதன் மூலம் தொடங்குவோம்:

import pandas as pd

பாண்டாஸ் டேட்டாஃப்ரேமில் பல நெடுவரிசைகளைச் சேர்த்தல்

டேட்டாஃப்ரேமில் பல நெடுவரிசைகளைச் சேர்க்க, DataFrame.assign() முறையைப் பயன்படுத்தலாம். இந்த முறையானது டேட்டாஃப்ரேமில் ஒரே நேரத்தில் ஒன்று அல்லது பல நெடுவரிசைகளைச் சேர்க்க அனுமதிக்கிறது. மாதிரி டேட்டாஃப்ரேமை உருவாக்கி, பல நெடுவரிசைகள் ஏற்கனவே இல்லை என்றால் அதில் சேர்ப்போம்:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

ஆம் மேலே குறியீடு துணுக்கு, முதலில் 'column1' மற்றும் 'column2' ஆகிய இரண்டு நெடுவரிசைகளுடன் மாதிரி தரவுச்சட்டத்தை உருவாக்குகிறோம். நாங்கள் டேட்டாஃப்ரேமில் சேர்க்க விரும்பும் புதிய நெடுவரிசைகளின் பட்டியலை உருவாக்குகிறோம், 'column3' மற்றும் 'column4'. இறுதியாக, நாங்கள் நெடுவரிசைகளின் பட்டியலை மீண்டும் செய்கிறோம் மற்றும் தரவுச்சட்டத்தில் ஏற்கனவே இல்லை என்றால் புதிய நெடுவரிசையைச் சேர்ப்போம்.

படிப்படியான விளக்கம்

இங்கே ஒரு படி ஒவ்வொரு பகுதியின் விளக்கம் எங்கள் தீர்வு:

1. "இறக்குமதி பாண்டாக்களை pd ஆக" பயன்படுத்தி பாண்டாஸ் நூலகத்தை இறக்குமதி செய்வதன் மூலம் தொடங்குகிறோம்.
2. அடுத்து, 'df' எனப்படும் மாதிரி தரவுச்சட்டத்தை இரண்டு நெடுவரிசைகளுடன் உருவாக்குகிறோம்: 'column1' மற்றும் 'column2'.
3. டேட்டாஃப்ரேமில் நாம் சேர்க்க விரும்பும் புதிய நெடுவரிசைகளின் பட்டியலை உருவாக்குகிறோம் - 'column3' மற்றும் 'column4'.
4. புதிய நெடுவரிசைகளின் பட்டியலின் மூலம் மீண்டும் மீண்டும் செய்ய ஒரு for loop ஐப் பயன்படுத்துகிறோம்.
5. லூப்பில், புதிய நெடுவரிசை ஏற்கனவே டேட்டாஃப்ரேமில் உள்ளதா என்பதை 'not in' நிலையில் பயன்படுத்தி சரிபார்க்கிறோம். புதிய நெடுவரிசை இல்லை என்றால், டேட்டாஃப்ரேமில் புதிய நெடுவரிசையை எதுவுமில்லை என்ற இயல்புநிலை மதிப்புடன் சேர்க்கிறோம்.

பாண்டாஸ் செயல்பாடுகள் மற்றும் நூலகங்கள்

டேட்டாஃப்ரேம்களைக் கையாளுதல் மற்றும் கையாளுதல் ஆகியவற்றை எளிதாக்கும் பரந்த அளவிலான செயல்பாடுகள் மற்றும் முறைகளை பாண்டாஸ் வழங்குகிறது. எங்கள் தீர்வில், பின்வரும் முக்கிய கூறுகளைப் பயன்படுத்தினோம்:

  • டேட்டாஃப்ரேம் - பாண்டாக்களில் முதன்மையான தரவுக் கட்டமைப்பாக, DataFrame என்பது இரு பரிமாண, மாறக்கூடிய, பெயரிடப்பட்ட அச்சுகள் (வரிசைகள் மற்றும் நெடுவரிசைகள்) கொண்ட பன்முகத்தன்மை கொண்ட அட்டவணைத் தரவு ஆகும்.
  • DataFrame.columns - இந்த பண்பு DataFrame இன் நெடுவரிசை லேபிள்களை வழங்குகிறது, இது ஒரு நெடுவரிசை உள்ளதா இல்லையா என்பதை அணுகவும் சரிபார்க்கவும் அனுமதிக்கிறது.
  • pd.DataFrame() - இது ஒரு புதிய டேட்டாஃப்ரேமை உருவாக்குவதற்கான கன்ஸ்ட்ரக்டர் செயல்பாடு ஆகும். உருவாக்கத்தின் போது தரவு மற்றும் நெடுவரிசை பெயர்களை வரையறுக்க இது உங்களை அனுமதிக்கிறது.

இப்போது எப்படி செய்வது என்பது பற்றி உங்களுக்கு நன்றாகப் புரியும் பல நெடுவரிசைகளைச் சேர்க்கவும் ஒரு பாண்டாஸ் டேட்டாஃப்ரேமுக்கு, இந்த நுட்பம் தரவை திறமையாக நிர்வகிக்கவும் கையாளவும் உதவும். தரவு பகுப்பாய்வு மற்றும் கையாளுதலுக்கான பல சக்திவாய்ந்த அம்சங்களை பாண்டாஸ் வழங்குகிறது என்பதை நினைவில் கொள்ளுங்கள், எனவே அவற்றையும் ஆராய்ந்து மிகவும் பயனுள்ள பைதான் டெவலப்பராக மாறவும்.

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை