Pandas to powszechnie używana biblioteka Pythona do manipulacji i analizy danych oraz I loc to kluczowa funkcja w bibliotece, która umożliwia użytkownikom wybieranie danych i manipulowanie nimi za pomocą indeksowania opartego na liczbach całkowitych. Może to być szczególnie przydatne podczas pracy z dużymi zbiorami danych. W tym artykule przyjrzymy się użyciu pandy iloc w różnych scenariuszach i wyjaśnij krok po kroku, jak działa ta funkcja, aby pomóc Ci zrozumieć jej znaczenie i potencjalne zastosowania w analizie danych.
pandas iloc: Rozwiązanie powszechnego problemu
Częstym wyzwaniem, przed którym stoją analitycy danych, jest efektywne wybieranie i analizowanie określonych części ich zbioru danych. Obiekt DataFrame w pandas oferuje wiele doskonałych metod radzenia sobie z tymi wyzwaniami, a jedną z najbardziej wszechstronnych i potężnych funkcji jest I loc indeksator. Umożliwia użytkownikom dostęp do wierszy i kolumn DataFrame na podstawie indeksowania opartego na liczbach całkowitych.
Zacznijmy od omówienia krok po kroku wyjaśnienia, jak używać iloc w praktycznym scenariuszu analizy danych.
Wyjaśnienie krok po kroku Pandy iloc
Korzystanie z pandas iloc jest proste i intuicyjne. Załóżmy, że mamy następującą ramkę DataFrame:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
Nasza DataFrame ma 4 wiersze i 3 kolumny. Aby korzystać z iloc, musisz podać indeksy dla wierszy i kolumn, do których chcesz uzyskać dostęp. Oto kilka przykładów:
1. Dostęp do określonego wiersza i kolumny:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. Dostęp do zakresu wierszy i kolumn:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. Dostęp do określonych wierszy i kolumn:
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
Biblioteki i zależności
Aby korzystać z pandy iloc, musisz mieć zainstalowaną bibliotekę pandas, a także wszelkie inne biblioteki, od których zależą pandy, takie jak NumPy. Możesz je zainstalować za pomocą pip lub conda:
pip install pandas numpy
or
conda install pandas numpy
Po zainstalowaniu bibliotek możesz zacząć używać pandas i iloc w swoim środowisku Pythona, jak pokazano w powyższych przykładach.
Inne powiązane funkcje i metody indeksowania
Oprócz I loc, pandas zapewnia kilka innych funkcji i metod indeksowania, które mogą być przydatne w różnych sytuacjach. Niektóre z głównych to:
- lokalizacja: Ten indeksator umożliwia użytkownikom dostęp do wierszy i kolumn na podstawie indeksowania opartego na etykietach, a nie indeksowania opartego na liczbach całkowitych, takiego jak iloc.
- pod adresem: Służy do uzyskiwania dostępu do pojedynczej wartości na podstawie indeksowania opartego na etykiecie.
- m.in.: Podobne do „at”, ale dla indeksowania opartego na liczbach całkowitych. Służy do uzyskiwania dostępu do pojedynczej wartości w oparciu o indeksowanie oparte na liczbach całkowitych.
Poznanie tych funkcji i zrozumienie, w jaki sposób można ich używać w połączeniu z iloc, wzmocni Twoją zdolność do wykonywania złożonych manipulacji danymi za pomocą pand.