Вирішено: додайте кілька стовпців до фрейму даних, якщо панди не існує

Pandas — це бібліотека Python з відкритим вихідним кодом, яка забезпечує високопродуктивні, прості у використанні структури даних та інструменти аналізу даних. Це стало основним вибором для розробників і дослідників даних, коли мова заходить про маніпулювання та аналіз даних. Однією з потужних функцій Pandas є створення та модифікація кадрів даних. У цій статті ми розглянемо процес додавання кількох стовпців до фрейму даних, якщо вони не існують, за допомогою бібліотеки pandas. Ми крок за кроком розглянемо код і заглибимося в пов’язані функції, бібліотеки та проблеми, з якими ви можете зіткнутися на цьому шляху.

Робота з фреймами даних має вирішальне значення під час обробки даних, і часто ви можете опинитися в ситуації, коли вам потрібно додати декілька стовпців одночасно до фрейму даних. Це може бути складно, але бібліотека Pandas робить це завдання гладким і ефективним. Спочатку почнемо з імпорту бібліотеки Pandas:

import pandas as pd

Додавання кількох стовпців до Pandas Dataframe

Щоб додати кілька стовпців до фрейму даних, ми можемо використати метод DataFrame.assign(). Цей метод дозволяє нам додати один або кілька стовпців до фрейму даних одночасно. Давайте створимо зразок кадру даних, а потім додамо до нього кілька стовпців, якщо вони ще не існують:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

У фрагмент коду вище, ми спочатку створюємо зразок кадру даних із двома стовпцями, 'column1' і 'column2'. Потім ми створюємо список нових стовпців, 'column3' і 'column4', які ми хочемо додати до фрейму даних. Нарешті, ми переглядаємо список стовпців і додаємо новий стовпець, якщо він ще не існує у фреймі даних.

Покрокове пояснення

Ось крок за кроком пояснення кожної частини нашого рішення:

1. Ми починаємо з імпорту бібліотеки Pandas за допомогою «import pandas as pd».
2. Далі ми створюємо зразок кадру даних під назвою «df» із двома стовпцями: «column1» і «column2».
3. Ми створюємо список нових стовпців, які хочемо додати до фрейму даних – 'column3' і 'column4'.
4. Ми використовуємо цикл for для перебору списку нових стовпців.
5. У циклі ми перевіряємо, чи новий стовпець уже існує у кадрі даних, використовуючи умову «not in». Якщо новий стовпець не існує, ми додаємо новий стовпець до фрейму даних із значенням за замовчуванням None.

Функції та бібліотеки Pandas

Pandas пропонує широкий спектр функцій і методів, які спрощують обробку кадрів даних і маніпулювання ними. У нашому рішенні ми використали такі ключові компоненти:

  • DataFrame – Як основна структура даних у pandas, DataFrame є двовимірними, змінними, потенційно різнорідними табличними даними з позначеними осями (рядками та стовпцями)
  • DataFrame.columns – Цей атрибут повертає мітки стовпців DataFrame, що дозволяє нам отримати доступ і перевірити, чи існує стовпець чи ні.
  • pd.DataFrame() – Це функція конструктора для створення нового кадру даних. Це дозволяє визначати дані та імена стовпців під час створення.

Тепер ви краще розумієте, як додати кілька стовпців до фрейму даних Pandas, ця техніка допоможе вам ефективно керувати та маніпулювати даними. Пам’ятайте, що Pandas пропонує багато інших потужних функцій для аналізу та обробки даних, тож обов’язково ознайомтеся з ними, щоб стати ефективнішим розробником Python.

Схожі повідомлення:

Залишити коментар