Pandas — це широко використовувана бібліотека Python для обробки та аналізу даних iloc є важливою функцією в бібліотеці, яка дозволяє користувачам вибирати та маніпулювати даними за допомогою цілочисельного індексування. Це може бути особливо корисним під час роботи з великими наборами даних. У цій статті ми розглянемо використання панди iloc у різних сценаріях і покроково поясніть, як ця функція працює, щоб допомогти вам зрозуміти її значення та потенційні застосування в аналізі даних.
pandas iloc: рішення загальної проблеми
Загальна проблема, з якою стикаються аналітики даних, полягає в тому, як ефективно вибрати й проаналізувати певні частини свого набору даних. Об’єкт DataFrame у pandas пропонує багато чудових методів вирішення цих завдань, і однією з найбільш універсальних і потужних функцій є iloc індексатор. Це дозволяє користувачам отримувати доступ до рядків і стовпців DataFrame на основі цілочисельного індексування.
Почнемо з обговорення покрокового пояснення того, як використовувати iloc у практичному сценарії аналізу даних.
Покрокове пояснення Pandas iloc
Використання pandas iloc просте та інтуїтивно зрозуміле. Припустимо, у нас є наступний DataFrame:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
Наш DataFrame має 4 рядки та 3 стовпці. Щоб використовувати iloc, вам потрібно надати індекси для рядків і стовпців, до яких ви хочете отримати доступ. Ось кілька прикладів:
1. Доступ до певного рядка та стовпця:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. Доступ до рядків і стовпців:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. Доступ до певних рядків і стовпців:
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
Бібліотеки та залежності
використовувати панди iloc, вам потрібно встановити бібліотеку pandas, а також будь-які інші бібліотеки, від яких залежить pandas, наприклад NumPy. Ви можете встановити їх через pip або conda:
pip install pandas numpy
or
conda install pandas numpy
Після встановлення бібліотек ви можете почати використовувати pandas і iloc у своєму середовищі Python, як показано в прикладах вище.
Інші пов’язані функції та методи індексування
На додаток до iloc, pandas надає кілька інших функцій і методів індексування, які можуть бути корисними в різних ситуаціях. Деякі з основних з них:
- місце: Цей індексатор дозволяє користувачам отримувати доступ до рядків і стовпців на основі індексування на основі міток, а не на основі цілочисельного індексування, як iloc.
- за адресою: Він використовується для доступу до одного значення на основі індексування на основі міток.
- iat: Подібно до 'at', але для цілочисельного індексування. Він використовується для доступу до одного значення на основі цілочисельного індексування.
Вивчення цих функцій і розуміння того, як їх можна використовувати в поєднанні з iloc, зміцнить вашу здатність виконувати складні маніпуляції з даними за допомогою pandas.