В днешния свят работата с данни се превърна в основно умение както за разработчиците, така и за анализаторите. Една мощна библиотека, която помага при извършването на анализ на данни, е панди, който е изграден върху езика за програмиране Python. В тази статия ще разгледаме как да инсталирате pandas в Python с помощта на отивам, разберете работата на библиотеката и проучете различни функции, които ще помогнат при задачите ни за анализ на данни. Така че, нека се потопим направо в него.
Инсталиране на pandas с помощта на Git
За да инсталирате pandas с помощта на Git, първо трябва да клонирате хранилището на pandas от GitHub на вашата локална машина. След като имате копие на хранилището, можете да следвате стъпките, споменати по-долу, за да настроите всичко правилно.
git clone git://github.com/pandas-dev/pandas.git cd pandas python -m venv venv source venv/bin/activate # On Windows use `venvScriptsactivate` pip install -e .
Кодът по-горе прави следното:
- Клонира хранилището на pandas.
- Променя текущата директория на папката pandas.
- Създава виртуална среда, наречена „venv“.
- Активира виртуалната среда.
- Инсталира pandas в режим на редактиране, което ще ви позволи да променяте изходния код директно.
Сега, след като имаме инсталирани pandas чрез Git, можем да започнем да работим с него в Python.
Първи стъпки с пандите
За да започнете да използвате pandas, ще трябва да импортирате библиотеката във вашия код на Python. Можете да направите това, като използвате следната команда:
import pandas as pd
С вече импортирани pandas можете да започнете да работите с набори от данни в различни формати, като CSV, Excel или SQL бази данни. Pandas използва две ключови структури от данни за манипулиране на данни: DataFrame намлява Серия.
DataFrame е двуизмерна таблица с обозначени оси, докато Series е едномерен, обозначен масив. Тези структури от данни ви позволяват да извършвате различни операции и анализи на вашите данни.
Зареждане и изследване на данни
За да демонстрираме как да използвате pandas, нека разгледаме примерен набор от данни – CSV файл с подробности за различни продукти, техните категории и цени. Можете да заредите файла и да създадете DataFrame по следния начин:
data = pd.read_csv('products.csv')
За да видите съдържанието на DataFrame, използвайте следната команда:
print(data.head())
- глава() функцията връща първите пет реда на DataFrame. Можете също така да извършвате други операции като изчисляване на статистика, филтриране на данни и манипулиране на колони с помощта на функциите на pandas.
Заключение
Чрез тази статия научихме как да инсталирайте pandas в Python с помощта на Git и изследва основните концепции на библиотеката, като DataFrames и Series. Освен това научихме за зареждането и изследването на данни с помощта на функциите на pandas. С тези фундаментални концепции вие вече сте оборудвани със знанията, необходими за изпълнение на задачи за анализ на данни във вашите проекти. Докато продължавате да работите с pandas, не забравяйте да изследвате огромния набор от функции и методи, които тази мощна библиотека може да предложи – винаги има още какво да научите в света на данните!