Lahendatud: lisa pandade andmeraamile uus veerg

Selles artiklis uurime uue veeru lisamise protsessi Pandas DataFrame'i, mis on Pythoni populaarses raamatukogus andmete töötlemiseks ja analüüsimiseks. Arutame selle probleemi lahenduse üle, anname koodi samm-sammult selgituse ning käsitleme Pandase teegis mõningaid seotud teemasid ja funktsioone. Pandas on laialdaselt kasutatav raamatukogu, mis sisaldab kõrgetasemelisi andmestruktuure ja tööriistu, mis sobivad suurepäraselt tõhusaks andmeanalüüsiks ja -käsitluseks.

Alustuseks oletame, et meil on andmestik Panda DataFrame'i kujul ja me tahame sellele lisada uue veeru. See on andmete ettevalmistamise etapis levinud nõue, mida on sageli vaja funktsioonide projekteerimiseks või olemasolevate veergude põhjal lisateabe genereerimiseks. Sukeldume sellesse, kuidas seda saavutada.

Panda DataFrame'i uue veeru lisamine

Alustame vajaliku teegi importimisest ja näidis DataFrame loomisest.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Nüüd lisame oma DataFrame'i uue veeru "Riik" vaikeväärtusega, öelge "USA".

df['Country'] = 'USA'

See lihtne koodirida lisab meie olemasolevasse DataFrame'i 'df' uue veeru nimega "Riik", mille kõigil ridadel on väärtus "USA". Meie värskendatud DataFrame näeks välja selline:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Koodi samm-sammult selgitus

Teeme koodi lahti ja mõistame seda samm-sammult.

1. Esiteks impordime Pandase teegi, kasutades standardset aliast 'pd'. See võimaldab meil pääseda juurde Panda funktsioonidele ja klassidele, kasutades eesliidet "pd".

import pandas as pd

2. Järgmiseks loome sõnastiku 'andmed', mis sisaldab mõningaid näidisandmeid. Iga sõnastiku klahv tähistab veeru nime ja sellele vastav väärtus on selle veeru väärtuste loend.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Seejärel teisendame selle sõnastiku funktsiooni "pd.DataFrame()" kasutades Pandase DataFrame'i objektiks.

df = pd.DataFrame(data)

4. Lõpuks, uue veeru lisamiseks kasutame lihtsalt andmeraamiga määramisoperaatorit “=”, pakkudes nurksulgudes uue veeru nime ja määrates vaikeväärtuse. Meie puhul lisasime veeru "Riik" vaikeväärtusega "USA".

df['Country'] = 'USA'

Panda raamatukogu ja sellega seotud funktsioonid

Pandas on võimas Pythoni teek, mis sobib eriti hästi andmetöötlus-, puhastus- ja analüüsitoiminguteks. See pakub kahte peamist andmestruktuuri: DataFrame ja Seeria. DataFrame on kahemõõtmeline tabeliline andmestruktuur, millel on märgistatud teljed (read ja veerud). Seevastu seeria on ühemõõtmeline märgistatud massiiv, mis suudab hoida mis tahes tüüpi andmeid.

Mõned levinumad Panda funktsioonid, mis on seotud DataFrame'i veergude lisamise, muutmise ja kustutamisega, on järgmised.

  • insert (): Veeru sisestamiseks määratud kohta.
  • drop (): Veeru eemaldamiseks DataFrame'ist.
  • rename (): DataFrame'i veeru ümbernimetamiseks.
  • määra(): Uue veeru loomiseks avaldise tulemuse põhjal.

Seega on Panda DataFrame'i uue veeru lisamine lihtne ja tõhus. Selles artiklis oleme käsitlenud uue vaikeväärtusega veeru lisamise põhimeetodit ja andnud üksikasjalikud selgitused kaasnevate toimingute kohta. Oleme tutvustanud Pandasid ka võimsa andmetöötlusteekina ja arutanud mõningaid sellega seotud funktsioone DataFrame'i veergude haldamiseks. Neid tehnikaid valdades saate Pythonis hästi hakkama mitmesuguste andmetöötlustoimingutega.

Seonduvad postitused:

Jäta kommentaar