Вирішено: додати новий стовпець до фрейму даних pandas

У цій статті ми розглянемо процес додавання нового стовпця до Pandas DataFrame, популярної бібліотеки Python для обробки та аналізу даних. Ми обговоримо вирішення цієї проблеми, розглянемо покрокове пояснення коду та розглянемо деякі пов’язані теми та функції в бібліотеці Pandas. Pandas — це широко використовувана бібліотека, що містить високорівневі структури даних і інструменти, ідеальні для ефективного аналізу даних і обробки завдань.

Для початку припустімо, що у нас є набір даних у формі Pandas DataFrame, і ми хочемо додати до нього новий стовпець. Це звичайна вимога на етапі підготовки даних, яка часто потрібна для розробки функцій або для створення додаткової інформації на основі існуючих стовпців. Давайте розберемося, як цього можна досягти.

Додавання нового стовпця до Pandas DataFrame

Ми почнемо з імпорту необхідної бібліотеки та створення зразка DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Тепер давайте додамо новий стовпець «Країна» до нашого DataFrame зі значенням за замовчуванням, скажімо, «США».

df['Country'] = 'USA'

Цей простий рядок коду додасть новий стовпець під назвою «Країна» до нашого існуючого DataFrame «df» зі значенням «США» в усіх його рядках. Наш оновлений DataFrame виглядатиме так:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Покрокове пояснення коду

Давайте розберемо код і зрозуміємо його крок за кроком.

1. Спочатку ми імпортуємо бібліотеку Pandas, використовуючи стандартний псевдонім «pd». Це дозволяє нам отримати доступ до функцій і класів Pandas за допомогою префікса «pd».

import pandas as pd

2. Далі ми створюємо «дані» словника, що містить деякі зразки даних. Кожен ключ у словнику представляє назву стовпця, а його відповідне значення є списком значень для цього стовпця.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Потім ми перетворюємо цей словник на об’єкт Pandas DataFrame за допомогою функції `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Нарешті, щоб додати новий стовпець, ми просто використовуємо оператор присвоєння «=» з DataFrame, надаючи назву нового стовпця в квадратних дужках і вказуючи значення за замовчуванням. У нашому випадку ми додали стовпець «Країна» зі значенням за замовчуванням «США».

df['Country'] = 'USA'

Бібліотека Pandas і відповідні функції

Pandas — це потужна бібліотека Python, яка особливо підходить для обробки даних, очищення й аналізу. Він забезпечує дві основні структури даних: DataFrame та Серія. DataFrame — це двовимірна таблична структура даних із позначеними осями (рядки та стовпці). Серія, з іншого боку, є одновимірним позначеним масивом, здатним зберігати дані будь-якого типу.

Деякі поширені функції Pandas, пов’язані з додаванням, зміною та видаленням стовпців у DataFrame, такі:

  • вставити(): Щоб вставити стовпець у вказану позицію.
  • drop(): Щоб видалити стовпець із DataFrame.
  • перейменувати(): Щоб перейменувати стовпець DataFrame.
  • призначити(): Щоб створити новий стовпець на основі результату виразу.

Отже, додавання нового стовпця до Pandas DataFrame є простим і ефективним. У цій статті ми розглянули основний метод додавання нового стовпця зі значенням за замовчуванням і надали детальні пояснення щодо відповідних кроків. Ми також представили Pandas як потужну бібліотеку для обробки даних і обговорили деякі пов’язані функції для керування стовпцями DataFrame. Освоївши ці методи, ви будете добре підготовлені для вирішення широкого кола завдань обробки даних на Python.

Схожі повідомлення:

Залишити коментар