Vyřešeno: přidejte nový sloupec do datového rámce pandas

V tomto článku prozkoumáme proces přidání nového sloupce do Pandas DataFrame, oblíbené knihovny v Pythonu pro manipulaci a analýzu dat. Probereme řešení tohoto problému, projdeme si podrobné vysvětlení kódu a pokryjeme některá související témata a funkce v knihovně Pandas. Pandas je široce používaná knihovna obsahující datové struktury a nástroje na vysoké úrovni, které jsou ideální pro efektivní analýzu dat a zpracování úloh.

Pro začátek předpokládejme, že máme datovou sadu ve formě Pandas DataFrame a chceme do ní přidat nový sloupec. Jedná se o běžný požadavek ve fázi přípravy dat, který je často potřebný pro konstrukci funkcí nebo pro generování dalších informací na základě existujících sloupců. Pojďme se ponořit do toho, jak toho lze dosáhnout.

Přidání nového sloupce do Pandas DataFrame

Začneme importem požadované knihovny a vytvořením ukázkového DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Nyní přidejte nový sloupec 'Country' do našeho DataFrame s výchozí hodnotou, řekněme 'USA'.

df['Country'] = 'USA'

Tento jednoduchý řádek kódu přidá nový sloupec s názvem 'Country' do našeho stávajícího DataFrame 'df' s hodnotou 'USA' ve všech jeho řádcích. Náš aktualizovaný DataFrame by vypadal takto:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Vysvětlení kódu krok za krokem

Pojďme si kód rozebrat a porozumět mu krok za krokem.

1. Nejprve importujeme knihovnu Pandas pomocí standardního aliasu 'pd'. To nám umožňuje přistupovat k funkcím a třídám Pandas pomocí předpony 'pd'.

import pandas as pd

2. Dále vytvoříme slovník 'data' obsahující některá ukázková data. Každý klíč ve slovníku představuje název sloupce a jeho odpovídající hodnota je seznam hodnot pro tento sloupec.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Tento slovník pak převedeme na objekt Pandas DataFrame pomocí funkce `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Nakonec pro přidání nového sloupce jednoduše použijeme operátor přiřazení „=“ s DataFrame, uvedeme název nového sloupce v hranatých závorkách a uvedeme výchozí hodnotu. V našem případě jsme přidali sloupec 'Země' s výchozí hodnotou 'USA'.

df['Country'] = 'USA'

Knihovna Pandas a související funkce

Pandas je výkonná Python knihovna, zvláště vhodná pro zpracování dat, čištění a analýzy. Poskytuje dvě hlavní datové struktury: DataFrame a Série. DataFrame je dvourozměrná tabulková datová struktura s označenými osami (řádky a sloupce). A Series je na druhé straně jednorozměrné označené pole schopné pojmout data jakéhokoli typu.

Některé běžné funkce Pandas související s přidáváním, úpravou a mazáním sloupců v DataFrame jsou následující:

  • vložit(): Chcete-li vložit sloupec na určené místo.
  • pokles(): Chcete-li odebrat sloupec z DataFrame.
  • přejmenovat(): Chcete-li přejmenovat sloupec DataFrame.
  • přiřadit(): Chcete-li vytvořit nový sloupec na základě výsledku výrazu.

Přidání nového sloupce do Pandas DataFrame je tedy jednoduché a efektivní. V tomto článku jsme se zabývali základní metodou přidání nového sloupce s výchozí hodnotou a poskytli jsme podrobné vysvětlení příslušných kroků. Také jsme představili Pandas jako výkonnou knihovnu pro manipulaci s daty a probrali některé související funkce pro správu sloupců DataFrame. Zvládnutím těchto technik budete dobře vybaveni pro zvládnutí široké škály úloh zpracování dat v Pythonu.

Související příspěvky:

Zanechat komentář