У цій статті ми розглянемо процес додавання нового стовпця до Pandas DataFrame, популярної бібліотеки Python для обробки та аналізу даних. Ми обговоримо вирішення цієї проблеми, розглянемо покрокове пояснення коду та розглянемо деякі пов’язані теми та функції в бібліотеці Pandas. Pandas — це широко використовувана бібліотека, що містить високорівневі структури даних і інструменти, ідеальні для ефективного аналізу даних і обробки завдань.
Для початку припустімо, що у нас є набір даних у формі Pandas DataFrame, і ми хочемо додати до нього новий стовпець. Це звичайна вимога на етапі підготовки даних, яка часто потрібна для розробки функцій або для створення додаткової інформації на основі існуючих стовпців. Давайте розберемося, як цього можна досягти.
Додавання нового стовпця до Pandas DataFrame
Ми почнемо з імпорту необхідної бібліотеки та створення зразка DataFrame.
import pandas as pd data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']} df = pd.DataFrame(data)
Тепер давайте додамо новий стовпець «Країна» до нашого DataFrame зі значенням за замовчуванням, скажімо, «США».
df['Country'] = 'USA'
Цей простий рядок коду додасть новий стовпець під назвою «Країна» до нашого існуючого DataFrame «df» зі значенням «США» в усіх його рядках. Наш оновлений DataFrame виглядатиме так:
Name Age City Country 0 Alex 25 NY USA 1 Tom 28 LA USA 2 Nick 23 SF USA 3 Sam 22 Chicago USA
Покрокове пояснення коду
Давайте розберемо код і зрозуміємо його крок за кроком.
1. Спочатку ми імпортуємо бібліотеку Pandas, використовуючи стандартний псевдонім «pd». Це дозволяє нам отримати доступ до функцій і класів Pandas за допомогою префікса «pd».
import pandas as pd
2. Далі ми створюємо «дані» словника, що містить деякі зразки даних. Кожен ключ у словнику представляє назву стовпця, а його відповідне значення є списком значень для цього стовпця.
data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']}
3. Потім ми перетворюємо цей словник на об’єкт Pandas DataFrame за допомогою функції `pd.DataFrame()`.
df = pd.DataFrame(data)
4. Нарешті, щоб додати новий стовпець, ми просто використовуємо оператор присвоєння «=» з DataFrame, надаючи назву нового стовпця в квадратних дужках і вказуючи значення за замовчуванням. У нашому випадку ми додали стовпець «Країна» зі значенням за замовчуванням «США».
df['Country'] = 'USA'
Бібліотека Pandas і відповідні функції
Pandas — це потужна бібліотека Python, яка особливо підходить для обробки даних, очищення й аналізу. Він забезпечує дві основні структури даних: DataFrame та Серія. DataFrame — це двовимірна таблична структура даних із позначеними осями (рядки та стовпці). Серія, з іншого боку, є одновимірним позначеним масивом, здатним зберігати дані будь-якого типу.
Деякі поширені функції Pandas, пов’язані з додаванням, зміною та видаленням стовпців у DataFrame, такі:
- вставити(): Щоб вставити стовпець у вказану позицію.
- drop(): Щоб видалити стовпець із DataFrame.
- перейменувати(): Щоб перейменувати стовпець DataFrame.
- призначити(): Щоб створити новий стовпець на основі результату виразу.
Отже, додавання нового стовпця до Pandas DataFrame є простим і ефективним. У цій статті ми розглянули основний метод додавання нового стовпця зі значенням за замовчуванням і надали детальні пояснення щодо відповідних кроків. Ми також представили Pandas як потужну бібліотеку для обробки даних і обговорили деякі пов’язані функції для керування стовпцями DataFrame. Освоївши ці методи, ви будете добре підготовлені для вирішення широкого кола завдань обробки даних на Python.