У данашњем свету, бављење подацима постало је суштинска вештина и за програмере и за аналитичаре. Једна моћна библиотека која помаже у обављању анализе података је панде, који је изграђен на врху програмског језика Питхон. У овом чланку ћемо погледати како да инсталирате панде у Питхон користећи гит, разумеју рад библиотеке и истражују различите функције које ће нам помоћи у задацима анализе података. Дакле, хајде да заронимо директно у то.
Инсталирање панди користећи Гит
Да бисте инсталирали панде користећи Гит, прво морате да клонирате пандас спремиште са ГитХуб-а на вашу локалну машину. Када добијете копију спремишта, можете пратити доле наведене кораке да бисте све исправно подесили.
git clone git://github.com/pandas-dev/pandas.git cd pandas python -m venv venv source venv/bin/activate # On Windows use `venvScriptsactivate` pip install -e .
Код изнад ради следеће:
- Клонира пандас складиште.
- Мења тренутни директоријум у фасциклу пандас.
- Ствара виртуелно окружење под називом „венв“.
- Активира виртуелно окружење.
- Инсталира панде у режиму за уређивање, што ће вам омогућити да директно измените изворни код.
Сада када имамо панде инсталиране преко Гита, можемо почети да радимо са њима у Питхон-у.
Почетак рада са пандама
Да бисте почели да користите панде, мораћете да увезете библиотеку у свој Питхон код. То можете учинити помоћу следеће команде:
import pandas as pd
Са сада увезеним пандама, можете почети да радите са скуповима података у различитим форматима, као што су ЦСВ, Екцел или СКЛ базе података. Пандас користи две кључне структуре података за манипулацију подацима: Оквир података Серија.
ДатаФраме је дводимензионална табела са означеним осовинама, док је серија једнодимензионални, означени низ. Ове структуре података вам омогућавају да обављате различите операције и анализе на вашим подацима.
Учитавање и истраживање података
Да бисмо показали како се користе панде, хајде да размотримо пример скупа података – ЦСВ датотеку са детаљима о различитим производима, њиховим категоријама и ценама. Можете учитати датотеку и креирати ДатаФраме овако:
data = pd.read_csv('products.csv')
Да бисте видели садржај ДатаФраме-а, користите следећу команду:
print(data.head())
глава() функција враћа првих пет редова ДатаФраме-а. Такође можете да обављате друге операције као што су израчунавање статистике, филтрирање података и манипулација колонама користећи пандас функције.
Zakljucak
Кроз овај чланак смо научили како да инсталирајте панде у Питхон користећи Гит и истражили основне концепте библиотеке, као што су оквири података и серије. Поред тога, научили смо о учитавању и истраживању података помоћу пандас функција. Са овим основним концептима, сада сте опремљени знањем потребним за обављање задатака анализе података у вашим пројектима. Док настављате да радите са пандама, обавезно истражите широку лепезу функција и метода које ова моћна библиотека може да понуди – увек има више за научити у свету података!