Pandas je široko používaná knižnica Pythonu na manipuláciu a analýzu údajov a iloc je kľúčová funkcia v rámci knižnice, ktorá umožňuje používateľom vyberať a manipulovať s údajmi pomocou celočíselného indexovania. To môže byť užitočné najmä pri práci s veľkými množinami údajov. V tomto článku preskúmame použitie pandy iloc v rôznych scenároch a vysvetlite, ako funkcia funguje, krok za krokom, aby ste pochopili jej význam a potenciálne aplikácie pri analýze údajov.
pandas iloc: Riešenie bežného problému
Spoločnou výzvou, ktorej čelia analytici údajov, je, ako efektívne vybrať a analyzovať konkrétne časti ich súboru údajov. Objekt DataFrame v pandách ponúka mnoho vynikajúcich metód na riešenie týchto problémov a jednou z najuniverzálnejších a najvýkonnejších funkcií je iloc indexátor. Umožňuje používateľom prístup k riadkom a stĺpcom dátového rámca na základe celočíselného indexovania.
Začnime diskusiou o podrobnom vysvetlení, ako používať iloc v praktickom scenári analýzy údajov.
Krok za krokom vysvetlenie Pandas iloc
Používanie pandas iloc je jednoduché a intuitívne. Predpokladajme, že máme nasledujúci DataFrame:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
Náš DataFrame má 4 riadky a 3 stĺpce. Ak chcete použiť iloc, musíte poskytnúť indexy pre riadky a stĺpce, ku ktorým chcete získať prístup. Tu je niekoľko príkladov:
1. Prístup ku konkrétnemu riadku a stĺpcu:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. Prístup k rozsahu riadkov a stĺpcov:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. Prístup ku konkrétnym riadkom a stĺpcom:
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
Knižnice a závislosti
na použitie pandy iloc, musíte mať nainštalovanú knižnicu pandy, ako aj všetky ostatné knižnice, na ktorých pandy závisia, ako napríklad NumPy. Môžete ich nainštalovať cez pip alebo conda:
pip install pandas numpy
or
conda install pandas numpy
Po nainštalovaní knižníc môžete začať používať pandy a iloc vo svojom prostredí Python, ako je uvedené v príkladoch vyššie.
Ďalšie súvisiace funkcie a metódy indexovania
Okrem iloc, pandas poskytuje niekoľko ďalších indexovacích funkcií a metód, ktoré môžu byť užitočné v rôznych situáciách. Niektoré z hlavných sú:
- loc: Tento indexátor umožňuje používateľom pristupovať k riadkom a stĺpcom na základe indexovania založeného na štítkoch, a nie indexovania založeného na celých číslach, ako je iloc.
- na: Používa sa na prístup k jednej hodnote na základe indexovania na základe štítkov.
- iat: Podobné ako 'at', ale pre celočíselné indexovanie. Používa sa na prístup k jednej hodnote založenej na celočíselnom indexovaní.
Preskúmanie týchto funkcií a pochopenie toho, ako ich možno použiť v kombinácii s iloc, posilní vašu schopnosť vykonávať zložité manipulácie s údajmi pomocou pand.