Vyriešené: pridajte nový stĺpec do dátového rámca pandas

V tomto článku preskúmame proces pridávania nového stĺpca do Pandas DataFrame, populárnej knižnice v Pythone na manipuláciu a analýzu údajov. Budeme diskutovať o riešení tohto problému, prejdeme si podrobné vysvetlenie kódu a pokryjeme niektoré súvisiace témy a funkcie v knižnici Pandas. Pandas je široko používaná knižnica obsahujúca dátové štruktúry a nástroje na vysokej úrovni, ktoré sú ideálne pre efektívnu analýzu dát a úlohy spracovania.

Na začiatok predpokladajme, že máme súbor údajov vo forme Pandas DataFrame a chceme doň pridať nový stĺpec. Toto je bežná požiadavka vo fáze prípravy údajov, ktorá je často potrebná na inžinierstvo funkcií alebo na generovanie dodatočných informácií na základe existujúcich stĺpcov. Poďme sa ponoriť do toho, ako sa to dá dosiahnuť.

Pridanie nového stĺpca do Pandas DataFrame

Začneme importovaním požadovanej knižnice a vytvorením vzorového DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Teraz do nášho DataFrame pridajte nový stĺpec „Krajina“ s predvolenou hodnotou, povedzme „USA“.

df['Country'] = 'USA'

Tento jednoduchý riadok kódu pridá nový stĺpec s názvom „Country“ do nášho existujúceho DataFrame „df“ s hodnotou „USA“ vo všetkých jeho riadkoch. Náš aktualizovaný DataFrame by vyzeral takto:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Vysvetlenie kódu krok za krokom

Poďme rozobrať kód a pochopiť ho krok za krokom.

1. Najprv importujeme knižnicu Pandas pomocou štandardného aliasu 'pd'. To nám umožňuje pristupovať k funkciám a triedam Pandas pomocou predpony 'pd'.

import pandas as pd

2. Ďalej vytvoríme slovník 'údajov' obsahujúci niektoré vzorové údaje. Každý kľúč v slovníku predstavuje názov stĺpca a jeho zodpovedajúca hodnota je zoznam hodnôt pre daný stĺpec.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Tento slovník potom prevedieme na objekt Pandas DataFrame pomocou funkcie `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Nakoniec na pridanie nového stĺpca jednoducho použijeme operátor priradenia „=“ s DataFrame, pričom v hranatých zátvorkách uvedieme názov nového stĺpca a určíme predvolenú hodnotu. V našom prípade sme pridali stĺpec 'Krajina' s predvolenou hodnotou 'USA'.

df['Country'] = 'USA'

Knižnica Pandas a súvisiace funkcie

Pandas je výkonná knižnica Python, vhodná najmä na spracovanie údajov, čistenie a analýzy. Poskytuje dve hlavné dátové štruktúry: DataFrame a Séria. DataFrame je dvojrozmerná tabuľková dátová štruktúra s označenými osami (riadky a stĺpce). Séria je na druhej strane jednorozmerné označené pole schopné uchovávať údaje akéhokoľvek typu.

Niektoré bežné funkcie Pandas súvisiace s pridávaním, úpravou a odstraňovaním stĺpcov v DataFrame sú nasledovné:

  • vložiť(): Ak chcete vložiť stĺpec na určené miesto.
  • pokles(): Ak chcete odstrániť stĺpec z DataFrame.
  • premenovať (): Ak chcete premenovať stĺpec DataFrame.
  • priradiť(): Na vytvorenie nového stĺpca na základe výsledku výrazu.

Takže pridanie nového stĺpca do Pandas DataFrame je jednoduché a efektívne. V tomto článku sme sa zaoberali základnou metódou pridania nového stĺpca s predvolenou hodnotou a poskytli sme podrobné vysvetlenia príslušných krokov. Predstavili sme tiež Pandas ako výkonnú knižnicu na manipuláciu s údajmi a diskutovali sme o niektorých súvisiacich funkciách na správu stĺpcov DataFrame. Osvojením si týchto techník budete dobre vybavení na zvládanie širokého spektra úloh spracovania dát v Pythone.

Súvisiace príspevky:

Pridať komentár