இன்றைய உலகில், தரவுகளைக் கையாள்வது டெவலப்பர்கள் மற்றும் ஆய்வாளர்களுக்கு இன்றியமையாத திறமையாக மாறியுள்ளது. தரவு பகுப்பாய்வு செய்ய உதவும் ஒரு சக்திவாய்ந்த நூலகம் பாண்டாக்கள், இது பைதான் நிரலாக்க மொழியின் மேல் கட்டப்பட்டுள்ளது. இந்த கட்டுரையில், பைத்தானில் பாண்டாக்களை எவ்வாறு நிறுவுவது என்பதைப் பார்ப்போம் Git தகவல், நூலகத்தின் செயல்பாட்டைப் புரிந்துகொண்டு, எங்கள் தரவு பகுப்பாய்வு பணிகளுக்கு உதவும் பல்வேறு செயல்பாடுகளை ஆராயுங்கள். எனவே, நாம் அதில் முழுக்கு போடுவோம்.
Git ஐப் பயன்படுத்தி பாண்டாக்களை நிறுவுதல்
Git ஐப் பயன்படுத்தி பாண்டாக்களை நிறுவ, நீங்கள் முதலில் GitHub இலிருந்து உங்கள் உள்ளூர் இயந்திரத்திற்கு பாண்டாஸ் களஞ்சியத்தை குளோன் செய்ய வேண்டும். களஞ்சியத்தின் நகல் உங்களிடம் கிடைத்ததும், எல்லாவற்றையும் சரியாக அமைக்க கீழே குறிப்பிடப்பட்டுள்ள படிகளைப் பின்பற்றலாம்.
git clone git://github.com/pandas-dev/pandas.git cd pandas python -m venv venv source venv/bin/activate # On Windows use `venvScriptsactivate` pip install -e .
மேலே உள்ள குறியீடு பின்வருவனவற்றைச் செய்கிறது:
- பாண்டாக்களின் களஞ்சியத்தை குளோன் செய்கிறது.
- தற்போதைய கோப்பகத்தை பாண்டாஸ் கோப்புறைக்கு மாற்றுகிறது.
- "venv" எனப்படும் மெய்நிகர் சூழலை உருவாக்குகிறது.
- மெய்நிகர் சூழலை செயல்படுத்துகிறது.
- திருத்தக்கூடிய பயன்முறையில் பாண்டாக்களை நிறுவுகிறது, இது மூலக் குறியீட்டை நேரடியாக மாற்ற உங்களை அனுமதிக்கும்.
இப்போது நாம் Git வழியாக பாண்டாக்களை நிறுவியுள்ளோம், அதை பைத்தானில் வேலை செய்ய ஆரம்பிக்கலாம்.
பாண்டாக்களுடன் தொடங்குதல்
பாண்டாக்களைப் பயன்படுத்தத் தொடங்க, உங்கள் பைதான் குறியீட்டில் நூலகத்தை இறக்குமதி செய்ய வேண்டும். பின்வரும் கட்டளையைப் பயன்படுத்தி இதைச் செய்யலாம்:
import pandas as pd
இப்போது இறக்குமதி செய்யப்பட்ட பாண்டாக்கள் மூலம், நீங்கள் CSV, Excel அல்லது SQL தரவுத்தளங்கள் போன்ற பல்வேறு வடிவங்களில் தரவுத்தொகுப்புகளுடன் பணிபுரியத் தொடங்கலாம். தரவு கையாளுதலுக்காக பாண்டாஸ் இரண்டு முக்கிய தரவு கட்டமைப்புகளைப் பயன்படுத்துகிறது: டேட்டாஃப்ரேம் மற்றும் தொடர்.
டேட்டாஃப்ரேம் என்பது இரு பரிமாண அட்டவணையாகும், அதே சமயம் ஒரு தொடர் என்பது ஒரு பரிமாண, பெயரிடப்பட்ட வரிசையாகும். இந்த தரவு கட்டமைப்புகள் உங்கள் தரவில் பல்வேறு செயல்பாடுகள் மற்றும் பகுப்பாய்வுகளை செய்ய உதவுகிறது.
தரவு ஏற்றுதல் மற்றும் ஆய்வு
பாண்டாக்களை எவ்வாறு பயன்படுத்துவது என்பதை விளக்குவதற்கு, மாதிரி தரவுத்தொகுப்பைக் கருத்தில் கொள்வோம் - வெவ்வேறு தயாரிப்புகள், அவற்றின் வகைகள் மற்றும் விலைகள் பற்றிய விவரங்கள் கொண்ட ஒரு CSV கோப்பு. நீங்கள் கோப்பை ஏற்றலாம் மற்றும் இது போன்ற ஒரு DataFrame ஐ உருவாக்கலாம்:
data = pd.read_csv('products.csv')
DataFrame இன் உள்ளடக்கங்களைக் காண, பின்வரும் கட்டளையைப் பயன்படுத்தவும்:
print(data.head())
தி தலை() செயல்பாடு DataFrame இன் முதல் ஐந்து வரிசைகளை வழங்குகிறது. புள்ளிவிவரங்களைக் கணக்கிடுதல், தரவை வடிகட்டுதல் மற்றும் பாண்டாஸ் செயல்பாடுகளைப் பயன்படுத்தி நெடுவரிசைகளைக் கையாளுதல் போன்ற பிற செயல்பாடுகளையும் நீங்கள் செய்யலாம்.
தீர்மானம்
இந்த கட்டுரையின் மூலம், எப்படி என்பதை நாங்கள் கற்றுக்கொண்டோம் Git ஐப் பயன்படுத்தி பைத்தானில் பாண்டாக்களை நிறுவவும் மற்றும் டேட்டாஃப்ரேம்கள் மற்றும் தொடர் போன்ற நூலகத்தின் அடிப்படைக் கருத்துகளை ஆராய்ந்தார். கூடுதலாக, பாண்டாஸ் செயல்பாடுகளைப் பயன்படுத்தி தரவை ஏற்றுவது மற்றும் ஆராய்வது பற்றி அறிந்தோம். இந்த அடிப்படைக் கருத்துகளுடன், உங்கள் திட்டங்களில் தரவு பகுப்பாய்வு பணிகளைச் செய்வதற்குத் தேவையான அறிவை நீங்கள் இப்போது பெற்றிருக்கிறீர்கள். நீங்கள் பாண்டாக்களுடன் தொடர்ந்து பணியாற்றும்போது, இந்த சக்திவாய்ந்த நூலகம் வழங்கும் பரந்த அளவிலான செயல்பாடுகள் மற்றும் முறைகளை ஆராய்வதை உறுதிப்படுத்திக் கொள்ளுங்கள் - தரவு உலகில் கற்றுக்கொள்ள இன்னும் நிறைய இருக்கிறது!