U današnjem svijetu, baratanje podacima postalo je ključna vještina kako za programere tako i za analitičare. Jedna moćna biblioteka koja pomaže u obavljanju analize podataka je pande, koji je izgrađen na vrhu programskog jezika Python. U ovom članku ćemo pogledati kako instalirati pande u Python koristeći ići, razumjeti rad biblioteke i istražiti različite funkcije koje će nam pomoći u zadacima analize podataka. Dakle, hajde da zaronimo odmah u to.
Instaliranje pandi koristeći Git
Da biste instalirali pande koristeći Git, prvo morate klonirati pandas spremište sa GitHub-a na vaš lokalni stroj. Nakon što dobijete kopiju spremišta, možete slijediti dolje navedene korake kako biste sve ispravno postavili.
git clone git://github.com/pandas-dev/pandas.git cd pandas python -m venv venv source venv/bin/activate # On Windows use `venvScriptsactivate` pip install -e .
Kod iznad radi sljedeće:
- Klonira pandas spremište.
- Mijenja trenutni direktorij u folder pandas.
- Kreira virtuelno okruženje pod nazivom “venv”.
- Aktivira virtuelno okruženje.
- Instalira pande u modu za uređivanje, što će vam omogućiti da direktno modificirate izvorni kod.
Sada kada imamo instalirane pande preko Gita, možemo početi raditi s njima u Pythonu.
Početak rada s pandama
Da biste počeli koristiti pande, morat ćete uvesti biblioteku u svoj Python kod. To možete učiniti pomoću sljedeće naredbe:
import pandas as pd
Sa sada uvezenim pandama, možete početi raditi sa skupovima podataka u različitim formatima, kao što su CSV, Excel ili SQL baze podataka. Pandas koristi dvije ključne strukture podataka za manipulaciju podacima: DataFrame i serija.
DataFrame je dvodimenzionalna tabela sa označenim osovinama, dok je serija jednodimenzionalni, označeni niz. Ove strukture podataka vam omogućavaju da izvršite različite operacije i analize na vašim podacima.
Učitavanje i istraživanje podataka
Da bismo demonstrirali kako koristiti pande, razmotrimo primjer skupa podataka – CSV datoteku s detaljima o različitim proizvodima, njihovim kategorijama i cijenama. Možete učitati datoteku i kreirati DataFrame ovako:
data = pd.read_csv('products.csv')
Za pregled sadržaja DataFramea koristite sljedeću naredbu:
print(data.head())
The glava () funkcija vraća prvih pet redova DataFramea. Također možete izvoditi druge operacije kao što su izračunavanje statistike, filtriranje podataka i manipulacija stupcima pomoću pandas funkcija.
zaključak
Kroz ovaj članak naučili smo kako instalirajte pande u Python koristeći Git i istražili osnovne koncepte biblioteke, kao što su okviri podataka i serije. Osim toga, naučili smo o učitavanju i istraživanju podataka pomoću pandas funkcija. Sa ovim osnovnim konceptima, sada ste opremljeni znanjem potrebnim za obavljanje zadataka analize podataka u vašim projektima. Dok nastavljate da radite sa pandama, svakako istražite široku lepezu funkcija i metoda koje ova moćna biblioteka može da ponudi – u svetu podataka uvek ima više za naučiti!