Вирішено: pandas iloc включає заголовок

Pandas — це широко використовувана бібліотека Python для обробки та аналізу даних iloc є важливою функцією в бібліотеці, яка дозволяє користувачам вибирати та маніпулювати даними за допомогою цілочисельного індексування. Це може бути особливо корисним під час роботи з великими наборами даних. У цій статті ми розглянемо використання панди iloc у різних сценаріях і покроково поясніть, як ця функція працює, щоб допомогти вам зрозуміти її значення та потенційні застосування в аналізі даних.

pandas iloc: рішення загальної проблеми

Загальна проблема, з якою стикаються аналітики даних, полягає в тому, як ефективно вибрати й проаналізувати певні частини свого набору даних. Об’єкт DataFrame у pandas пропонує багато чудових методів вирішення цих завдань, і однією з найбільш універсальних і потужних функцій є iloc індексатор. Це дозволяє користувачам отримувати доступ до рядків і стовпців DataFrame на основі цілочисельного індексування.

Почнемо з обговорення покрокового пояснення того, як використовувати iloc у практичному сценарії аналізу даних.

Покрокове пояснення Pandas iloc

Використання pandas iloc просте та інтуїтивно зрозуміле. Припустимо, у нас є наступний DataFrame:

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'],
        'Age': [25, 29, 21, 35],
        'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']}

df = pd.DataFrame(data)

Наш DataFrame має 4 рядки та 3 стовпці. Щоб використовувати iloc, вам потрібно надати індекси для рядків і стовпців, до яких ви хочете отримати доступ. Ось кілька прикладів:

1. Доступ до певного рядка та стовпця:

# Access row 2 (index 1) and column 'Name' (index 0)
selected_data = df.iloc[1, 0]
print(selected_data)  # Output: Bob

2. Доступ до рядків і стовпців:

# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1)
selected_data = df.iloc[0:2, 0:2]
print(selected_data)
# Output:
#     Name  Age
# 0  Alice   25
# 1    Bob   29

3. Доступ до певних рядків і стовпців:

# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2)
selected_data = df.iloc[[0, 3], [0, 2]]
print(selected_data)
# Output:
#     Name       City
# 0  Alice   New York
# 3  David     Boston

Бібліотеки та залежності

використовувати панди iloc, вам потрібно встановити бібліотеку pandas, а також будь-які інші бібліотеки, від яких залежить pandas, наприклад NumPy. Ви можете встановити їх через pip або conda:

pip install pandas numpy

or

conda install pandas numpy

Після встановлення бібліотек ви можете почати використовувати pandas і iloc у своєму середовищі Python, як показано в прикладах вище.

Інші пов’язані функції та методи індексування

На додаток до iloc, pandas надає кілька інших функцій і методів індексування, які можуть бути корисними в різних ситуаціях. Деякі з основних з них:

  • місце: Цей індексатор дозволяє користувачам отримувати доступ до рядків і стовпців на основі індексування на основі міток, а не на основі цілочисельного індексування, як iloc.
  • за адресою: Він використовується для доступу до одного значення на основі індексування на основі міток.
  • iat: Подібно до 'at', але для цілочисельного індексування. Він використовується для доступу до одного значення на основі цілочисельного індексування.

Вивчення цих функцій і розуміння того, як їх можна використовувати в поєднанні з iloc, зміцнить вашу здатність виконувати складні маніпуляції з даними за допомогою pandas.

Схожі повідомлення:

Залишити коментар