தீர்க்கப்பட்டது: கிட் மூலம் பைத்தானில் பாண்டாக்களை எவ்வாறு நிறுவுவது

இன்றைய உலகில், தரவுகளைக் கையாள்வது டெவலப்பர்கள் மற்றும் ஆய்வாளர்களுக்கு இன்றியமையாத திறமையாக மாறியுள்ளது. தரவு பகுப்பாய்வு செய்ய உதவும் ஒரு சக்திவாய்ந்த நூலகம் பாண்டாக்கள், இது பைதான் நிரலாக்க மொழியின் மேல் கட்டப்பட்டுள்ளது. இந்த கட்டுரையில், பைத்தானில் பாண்டாக்களை எவ்வாறு நிறுவுவது என்பதைப் பார்ப்போம் Git தகவல், நூலகத்தின் செயல்பாட்டைப் புரிந்துகொண்டு, எங்கள் தரவு பகுப்பாய்வு பணிகளுக்கு உதவும் பல்வேறு செயல்பாடுகளை ஆராயுங்கள். எனவே, நாம் அதில் முழுக்கு போடுவோம்.

Git ஐப் பயன்படுத்தி பாண்டாக்களை நிறுவுதல்

Git ஐப் பயன்படுத்தி பாண்டாக்களை நிறுவ, நீங்கள் முதலில் GitHub இலிருந்து உங்கள் உள்ளூர் இயந்திரத்திற்கு பாண்டாஸ் களஞ்சியத்தை குளோன் செய்ய வேண்டும். களஞ்சியத்தின் நகல் உங்களிடம் கிடைத்ததும், எல்லாவற்றையும் சரியாக அமைக்க கீழே குறிப்பிடப்பட்டுள்ள படிகளைப் பின்பற்றலாம்.

git clone git://github.com/pandas-dev/pandas.git
cd pandas
python -m venv venv
source venv/bin/activate  # On Windows use `venvScriptsactivate`
pip install -e .

மேலே உள்ள குறியீடு பின்வருவனவற்றைச் செய்கிறது:

  • பாண்டாக்களின் களஞ்சியத்தை குளோன் செய்கிறது.
  • தற்போதைய கோப்பகத்தை பாண்டாஸ் கோப்புறைக்கு மாற்றுகிறது.
  • "venv" எனப்படும் மெய்நிகர் சூழலை உருவாக்குகிறது.
  • மெய்நிகர் சூழலை செயல்படுத்துகிறது.
  • திருத்தக்கூடிய பயன்முறையில் பாண்டாக்களை நிறுவுகிறது, இது மூலக் குறியீட்டை நேரடியாக மாற்ற உங்களை அனுமதிக்கும்.

இப்போது நாம் Git வழியாக பாண்டாக்களை நிறுவியுள்ளோம், அதை பைத்தானில் வேலை செய்ய ஆரம்பிக்கலாம்.

பாண்டாக்களுடன் தொடங்குதல்

பாண்டாக்களைப் பயன்படுத்தத் தொடங்க, உங்கள் பைதான் குறியீட்டில் நூலகத்தை இறக்குமதி செய்ய வேண்டும். பின்வரும் கட்டளையைப் பயன்படுத்தி இதைச் செய்யலாம்:

import pandas as pd

இப்போது இறக்குமதி செய்யப்பட்ட பாண்டாக்கள் மூலம், நீங்கள் CSV, Excel அல்லது SQL தரவுத்தளங்கள் போன்ற பல்வேறு வடிவங்களில் தரவுத்தொகுப்புகளுடன் பணிபுரியத் தொடங்கலாம். தரவு கையாளுதலுக்காக பாண்டாஸ் இரண்டு முக்கிய தரவு கட்டமைப்புகளைப் பயன்படுத்துகிறது: டேட்டாஃப்ரேம் மற்றும் தொடர்.

டேட்டாஃப்ரேம் என்பது இரு பரிமாண அட்டவணையாகும், அதே சமயம் ஒரு தொடர் என்பது ஒரு பரிமாண, பெயரிடப்பட்ட வரிசையாகும். இந்த தரவு கட்டமைப்புகள் உங்கள் தரவில் பல்வேறு செயல்பாடுகள் மற்றும் பகுப்பாய்வுகளை செய்ய உதவுகிறது.

தரவு ஏற்றுதல் மற்றும் ஆய்வு

பாண்டாக்களை எவ்வாறு பயன்படுத்துவது என்பதை விளக்குவதற்கு, மாதிரி தரவுத்தொகுப்பைக் கருத்தில் கொள்வோம் - வெவ்வேறு தயாரிப்புகள், அவற்றின் வகைகள் மற்றும் விலைகள் பற்றிய விவரங்கள் கொண்ட ஒரு CSV கோப்பு. நீங்கள் கோப்பை ஏற்றலாம் மற்றும் இது போன்ற ஒரு DataFrame ஐ உருவாக்கலாம்:

data = pd.read_csv('products.csv')

DataFrame இன் உள்ளடக்கங்களைக் காண, பின்வரும் கட்டளையைப் பயன்படுத்தவும்:

print(data.head())

தி தலை() செயல்பாடு DataFrame இன் முதல் ஐந்து வரிசைகளை வழங்குகிறது. புள்ளிவிவரங்களைக் கணக்கிடுதல், தரவை வடிகட்டுதல் மற்றும் பாண்டாஸ் செயல்பாடுகளைப் பயன்படுத்தி நெடுவரிசைகளைக் கையாளுதல் போன்ற பிற செயல்பாடுகளையும் நீங்கள் செய்யலாம்.

தீர்மானம்

இந்த கட்டுரையின் மூலம், எப்படி என்பதை நாங்கள் கற்றுக்கொண்டோம் Git ஐப் பயன்படுத்தி பைத்தானில் பாண்டாக்களை நிறுவவும் மற்றும் டேட்டாஃப்ரேம்கள் மற்றும் தொடர் போன்ற நூலகத்தின் அடிப்படைக் கருத்துகளை ஆராய்ந்தார். கூடுதலாக, பாண்டாஸ் செயல்பாடுகளைப் பயன்படுத்தி தரவை ஏற்றுவது மற்றும் ஆராய்வது பற்றி அறிந்தோம். இந்த அடிப்படைக் கருத்துகளுடன், உங்கள் திட்டங்களில் தரவு பகுப்பாய்வு பணிகளைச் செய்வதற்குத் தேவையான அறிவை நீங்கள் இப்போது பெற்றிருக்கிறீர்கள். நீங்கள் பாண்டாக்களுடன் தொடர்ந்து பணியாற்றும்போது, ​​இந்த சக்திவாய்ந்த நூலகம் வழங்கும் பரந்த அளவிலான செயல்பாடுகள் மற்றும் முறைகளை ஆராய்வதை உறுதிப்படுத்திக் கொள்ளுங்கள் - தரவு உலகில் கற்றுக்கொள்ள இன்னும் நிறைய இருக்கிறது!

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை