Pandas on laialdaselt kasutatav Pythoni teek andmete töötlemiseks ja analüüsimiseks ning iloc on teegis ülioluline funktsioon, mis võimaldab kasutajatel andmeid täisarvupõhise indekseerimise teel valida ja nendega manipuleerida. See võib olla eriti kasulik suurte andmekogumitega töötamisel. Selles artiklis uurime selle kasutamist pandad iloc erinevates stsenaariumides ja selgitage samm-sammult, kuidas funktsioon töötab, et aidata teil mõista selle olulisust ja võimalikke rakendusi andmeanalüüsis.
pandas iloc: ühise probleemi lahendus
Andmeanalüütikute ühine väljakutse on see, kuidas tõhusalt valida ja analüüsida oma andmekogumi konkreetseid osi. DataFrame'i objekt pandades pakub palju suurepäraseid meetodeid nende väljakutsetega toimetulemiseks ning üks mitmekülgsemaid ja võimsamaid funktsioone on iloc indekseerija. See võimaldab kasutajatel täisarvupõhisel indekseerimisel põhineva juurdepääsu DataFrame'i ridadele ja veergudele.
Alustuseks arutame samm-sammult selgitust, kuidas ilocit praktilises andmeanalüüsi stsenaariumis kasutada.
Pandas iloci samm-sammult selgitus
Panda iloci kasutamine on lihtne ja intuitiivne. Oletame, et meil on järgmine DataFrame:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
Meie DataFrame'is on 4 rida ja 3 veergu. Iloci kasutamiseks peate esitama nende ridade ja veergude jaoks, millele soovite juurde pääseda, indeksid. siin on mõned näidised:
1. Juurdepääs konkreetsele reale ja veerule:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. Juurdepääs ridadele ja veergudele:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. Juurdepääs kindlatele ridadele ja veergudele.
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
Raamatukogud ja sõltuvused
Kasutada pandad iloc, peab teil olema installitud pandade teek, samuti kõik muud teegid, millest pandad sõltuvad, näiteks NumPy. Saate need installida pipi või conda kaudu:
pip install pandas numpy
or
conda install pandas numpy
Kui teegid on installitud, võite hakata kasutama pandasid ja iloci oma Pythoni keskkonnas, nagu on näidatud ülaltoodud näidetes.
Muud seotud funktsioonid ja indekseerimismeetodid
Lisaks iloc, pandad pakuvad mitmeid muid indekseerimisfunktsioone ja -meetodeid, mis võivad erinevates olukordades kasulikud olla. Mõned peamised on järgmised:
- asukoht: See indekseerija võimaldab kasutajatel pääseda juurde ridadele ja veergudele, mis põhinevad sildipõhisel indekseerimisel, mitte täisarvupõhisel indekseerimisel nagu iloc.
- aadressil: Seda kasutatakse sildipõhisel indekseerimisel põhinevale ühele väärtusele juurde pääsemiseks.
- iat: Sarnane 'at'-ga, kuid täisarvupõhise indekseerimise jaoks. Seda kasutatakse täisarvupõhisel indekseerimisel põhinevale ühele väärtusele juurde pääsemiseks.
Nende funktsioonide uurimine ja mõistmine, kuidas neid saab koos ilociga kasutada, tugevdab teie võimet teha pandade abil keerulisi andmetega manipuleerimisi.