தீர்க்கப்பட்டது: பாண்டாக்களில் csv இல் கமாவைச் சேர்க்கவும்

 

தரவு கையாளுதல் மற்றும் பகுப்பாய்வைக் கையாளும் போது CSV கோப்புகளுடன் பணிபுரிவது ஒரு பொதுவான பணியாகும். தரவுப் புலங்களைச் சரியாகப் பிரிப்பதற்காக CSV கோப்பில் காற்புள்ளிகளைச் சேர்க்க வேண்டிய அவசியம் அடிக்கடி எதிர்கொள்ளும் ஒரு பிரச்சனையாகும். இந்த கட்டுரையில், சக்திவாய்ந்த பைதான் லைப்ரரியான பாண்டாஸைப் பயன்படுத்தி CSV கோப்பில் காற்புள்ளிகளை எவ்வாறு சேர்ப்பது என்பது பற்றிய விவரங்களை ஆராய்வோம். குறியீட்டின் படிப்படியான விளக்கத்தை நாங்கள் வழங்குவோம், அதைத் தொடர்ந்து தொடர்புடைய நூலகங்கள் மற்றும் செயல்பாட்டில் ஈடுபட்டுள்ள செயல்பாடுகளை ஆழமாக ஆராய்வோம். எனவே உங்கள் தரவை இன்னும் ஒழுங்கமைத்து அணுகக்கூடியதாக மாற்றுவோம்!

பிரச்சனைக்கு தீர்வு

CSV கோப்பில் காற்புள்ளிகளைச் சேர்க்க, நாம் பாண்டாஸ் லைப்ரரியை நம்பலாம், இது CSV கையாளுதல் செயல்முறையை விரைவாகவும், சுத்தமாகவும், திறமையாகவும் செய்கிறது. உங்களிடம் ஏற்கனவே பாண்டாஸ் இல்லையென்றால் அதை நிறுவுவது முதல் படியாகும், இது உங்கள் டெர்மினலில் பின்வரும் கட்டளையை இயக்குவதன் மூலம் செய்யலாம்:

pip install pandas

Pandas ஐ நிறுவிய பிறகு, உங்கள் CSV கோப்பை ஏற்றி, தேவையான காற்புள்ளிகளைச் சேர்த்து, புதுப்பிக்கப்பட்ட தரவைக் கொண்டு புதிய CSV கோப்பை உருவாக்க வேண்டிய நேரம் இது.

குறியீட்டின் படிப்படியான விளக்கம்

1. பாண்டாஸ் நூலகத்தை இறக்குமதி செய்வதன் மூலம் தொடங்கவும்:

import pandas as pd

2. இதைப் பயன்படுத்தி உங்கள் CSV கோப்பை ஏற்றவும் pd.read_csv() செயல்பாடு. உங்கள் கோப்பிற்கான உண்மையான பாதையுடன் “input_file.csv” ஐ மாற்றுவதை உறுதிப்படுத்திக் கொள்ளுங்கள்.

csv_data = pd.read_csv("input_file.csv")

3. இப்போது நீங்கள் CSV கோப்பை Pandas DataFrame ஆப்ஜெக்ட்டில் ஏற்றிவிட்டீர்கள், தேவைக்கேற்ப அதை நீங்கள் கையாளலாம். இந்த வழக்கில், தரவு புலங்களைப் பிரிக்க காற்புள்ளிகளைச் சேர்க்க வேண்டும். இதைப் பயன்படுத்தி செய்யலாம் to_csv() செயல்பாடு, இது CSV கோப்பிற்கான டிலிமிட்டரைக் குறிப்பிட உங்களை அனுமதிக்கிறது.

csv_data.to_csv("output_file.csv", sep=",", index=False)

4. இறுதியாக, புதுப்பிக்கப்பட்ட CSV கோப்பு "output_file.csv" ஆக சரியான காற்புள்ளிகள் சேர்க்கப்படும்.

இப்போது, ​​சில தொடர்புடைய கருத்துக்கள், நூலகங்கள் மற்றும் செயல்பாடுகளுக்குள் நுழைவோம்.

பாண்டாஸ்: தரவு கையாளுதலுக்கான பவர்ஹவுஸ் நூலகம்

பாண்டாஸ் ஒரு ஓப்பன் சோர்ஸ் பைத்தானுக்கு தரவு கையாளுதல் மற்றும் பகுப்பாய்வு கருவிகளை வழங்கும் நூலகம். இது குறிப்பாக அட்டவணை தரவுகளுடன் பணிபுரிய வடிவமைக்கப்பட்டுள்ளது, தரவை திறம்பட கையாள, தொடர் மற்றும் DataFrame போன்ற தரவு கட்டமைப்புகளை வழங்குகிறது. Pandas ஆனது NumPy போன்ற பிற வலுவான மற்றும் திறமையான பைதான் நூலகங்களின் மேல் கட்டமைக்கப்பட்டுள்ளது, மேலும் இது CSV, Excel மற்றும் SQL தரவுத்தளங்கள் போன்ற தரவு மூலங்களுடன் தொடர்புகொள்வதற்கான உயர்நிலை இடைமுகத்தை வழங்குகிறது.

  • Pandas DataFrame: DataFrame என்பது 2-பரிமாண லேபிளிடப்பட்ட தரவு அமைப்பாகும், இது பல்வேறு வகையான நெடுவரிசைகளைக் கொண்டுள்ளது. இது பாண்டாஸ் வழங்கிய முதன்மை தரவு கையாளுதல் கருவியாகும் மேலும் இது பலதரப்பட்ட தரவு வடிவங்களைக் கையாள வடிவமைக்கப்பட்டுள்ளது.
  • பாண்டாஸ் தொடர்: தொடர் என்பது ஒரு பரிமாண லேபிளிடப்பட்ட வரிசையாகும், இது எந்த தரவு வகையையும் வைத்திருக்கும் திறன் கொண்டது. இது தரவுகளின் ஒற்றை நெடுவரிசைகளைக் கையாள வடிவமைக்கப்பட்டுள்ளது மற்றும் DataFrame க்கான கட்டுமானத் தொகுதியாகப் பயன்படுத்தப்படுகிறது.

பைதான் சிஎஸ்வி தொகுதி: பாண்டாக்களுக்கு ஒரு மாற்று

சிக்கலான பணிகளுக்கு CSV கோப்புகளுடன் வேலை செய்வதை பாண்டாஸ் எளிதாக்குகிறது, பைதான் ஒரு உள்ளமைக்கப்பட்ட தொகுதியை வழங்குகிறது CSV இது CSV கோப்புகளைப் படிக்கவும் எழுதவும் செயல்பாட்டை வழங்குகிறது.

csv தொகுதியில் வேலை செய்ய வேண்டிய முக்கிய வகுப்புகள்:

  • csv.reader: இந்த வகுப்பு ஒரு CSV கோப்பைப் படித்து, ஒவ்வொரு வரிசையையும் சரங்களின் பட்டியலாக உருவாக்க ஒரு மறு செய்கையை வழங்குகிறது.
  • csv.writer: இந்த வகுப்பு CSV கோப்பில் வரிசைகளை எழுதும் முறைகளை வழங்குகிறது.

Pandas அளவுக்கு சக்தி வாய்ந்ததாக இல்லாவிட்டாலும், உயர்நிலை தரவு கையாளுதல் தேவையில்லாத எளிமையான பணிகளுக்கு csv தொகுதி பொருத்தமான மாற்றாக இருக்கும் அல்லது உங்கள் திட்டத்தில் சார்புகளைப் பயன்படுத்த விரும்பவில்லை.

முடிவில், தரவு கையாளுதல் மற்றும் பகுப்பாய்வைக் கையாளும் போது CSV கோப்பில் காற்புள்ளிகளைச் சேர்ப்பது ஒரு முக்கியமான பணியாகும். பாண்டாஸ் போன்ற சக்திவாய்ந்த பைதான் நூலகத்தைப் பயன்படுத்துவது இந்த செயல்முறையை எளிதாக்குகிறது, இது நேராகவும் திறமையாகவும் செய்கிறது. Pandas பல அம்சங்கள் மற்றும் முறைகளை வழங்குகிறது, இது தரவை திறம்பட மற்றும் தடையின்றி கையாள உங்களை அனுமதிக்கிறது. மாற்றாக, எளிமையான பணிகளுக்கு, பைத்தானின் உள்ளமைக்கப்பட்ட csv தொகுதி பயன்படுத்தப்படலாம், இது CSV கோப்புகளுடன் பணிபுரிய தேவையான கருவிகளை வழங்குகிறது. தேர்ந்தெடுக்கப்பட்ட முறையைப் பொருட்படுத்தாமல், நன்கு கட்டமைக்கப்பட்ட தரவுகளுடன் பணிபுரிவது வெற்றிகரமான தரவு பகுப்பாய்வு மற்றும் கையாளுதலுக்கு முக்கியமாகும்.

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை