Pandas është një bibliotekë Python e përdorur gjerësisht për manipulimin dhe analizën e të dhënave dhe iloc është një funksion thelbësor brenda bibliotekës që lejon përdoruesit të zgjedhin dhe manipulojnë të dhënat me indeksimin e bazuar në numra të plotë. Kjo mund të jetë veçanërisht e dobishme kur punoni me grupe të dhënash të mëdha. Në këtë artikull, ne do të shqyrtojmë përdorimin e panda iloc në skenarë të ndryshëm dhe shpjegoni se si funksionon funksioni hap pas hapi për t'ju ndihmuar të kuptoni rëndësinë e tij dhe aplikimet e mundshme në analizën e të dhënave.
pandas iloc: Zgjidhja e një problemi të përbashkët
Një sfidë e zakonshme me të cilën përballen analistët e të dhënave është se si të zgjedhin dhe analizojnë në mënyrë efikase pjesë të veçanta të të dhënave të tyre. Objekti DataFrame në panda ofron shumë metoda të shkëlqyera për të trajtuar këto sfida, dhe një nga funksionet më të gjithanshme dhe më të fuqishme është iloc indeksues. Ai u mundëson përdoruesve të aksesojnë rreshtat dhe kolonat e një DataFrame bazuar në indeksimin e bazuar në numra të plotë.
Le të fillojmë duke diskutuar një shpjegim hap pas hapi se si të përdoret iloc në një skenar praktik të analizës së të dhënave.
Shpjegimi hap pas hapi i Pandas iloc
Përdorimi i pandas iloc është i thjeshtë dhe intuitiv. Supozoni se kemi DataFrame-n e mëposhtëm:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
DataFrame jonë ka 4 rreshta dhe 3 kolona. Për të përdorur iloc, duhet të jepni indekse për rreshtat dhe kolonat që dëshironi të përdorni. Ketu jane disa shembuj:
1. Hyrja në një rresht dhe kolonë specifike:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. Qasja në një varg rreshtash dhe kolonash:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. Qasja në rreshta dhe kolona specifike:
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
Bibliotekat dhe varësitë
Për të përdorur panda iloc, duhet të keni të instaluar bibliotekën e pandave, si dhe çdo bibliotekë tjetër nga e cila varen pandat, si p.sh. NumPy. Ju mund t'i instaloni ato përmes pip ose conda:
pip install pandas numpy
or
conda install pandas numpy
Pasi të instalohen bibliotekat, mund të filloni të përdorni panda dhe iloc në mjedisin tuaj Python siç tregohet në shembujt e mësipërm.
Funksione të tjera të ngjashme dhe metoda të indeksimit
Veç iloc, pandas ofron disa funksione dhe metoda të tjera indeksimi që mund të jenë të dobishme në situata të ndryshme. Disa nga kryesoret janë:
- vend: Ky indeksues i lejon përdoruesit të aksesojnë rreshtat dhe kolonat bazuar në indeksimin e bazuar në etiketë, në vend të indeksimit të bazuar në numra të plotë si iloc.
- në: Përdoret për të hyrë në një vlerë të vetme bazuar në indeksimin e bazuar në etiketë.
- iat: Ngjashëm me 'at', por për indeksimin e bazuar në numra të plotë. Përdoret për të hyrë në një vlerë të vetme bazuar në indeksimin e bazuar në numra të plotë.
Eksplorimi i këtyre funksioneve dhe kuptimi se si ato mund të përdoren në kombinim me iloc do të forcojë aftësinë tuaj për të kryer manipulime komplekse të të dhënave duke përdorur panda.