Selles artiklis uurime uue veeru lisamise protsessi Pandas DataFrame'i, mis on Pythoni populaarses raamatukogus andmete töötlemiseks ja analüüsimiseks. Arutame selle probleemi lahenduse üle, anname koodi samm-sammult selgituse ning käsitleme Pandase teegis mõningaid seotud teemasid ja funktsioone. Pandas on laialdaselt kasutatav raamatukogu, mis sisaldab kõrgetasemelisi andmestruktuure ja tööriistu, mis sobivad suurepäraselt tõhusaks andmeanalüüsiks ja -käsitluseks.
Alustuseks oletame, et meil on andmestik Panda DataFrame'i kujul ja me tahame sellele lisada uue veeru. See on andmete ettevalmistamise etapis levinud nõue, mida on sageli vaja funktsioonide projekteerimiseks või olemasolevate veergude põhjal lisateabe genereerimiseks. Sukeldume sellesse, kuidas seda saavutada.
Panda DataFrame'i uue veeru lisamine
Alustame vajaliku teegi importimisest ja näidis DataFrame loomisest.
import pandas as pd data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']} df = pd.DataFrame(data)
Nüüd lisame oma DataFrame'i uue veeru "Riik" vaikeväärtusega, öelge "USA".
df['Country'] = 'USA'
See lihtne koodirida lisab meie olemasolevasse DataFrame'i 'df' uue veeru nimega "Riik", mille kõigil ridadel on väärtus "USA". Meie värskendatud DataFrame näeks välja selline:
Name Age City Country 0 Alex 25 NY USA 1 Tom 28 LA USA 2 Nick 23 SF USA 3 Sam 22 Chicago USA
Koodi samm-sammult selgitus
Teeme koodi lahti ja mõistame seda samm-sammult.
1. Esiteks impordime Pandase teegi, kasutades standardset aliast 'pd'. See võimaldab meil pääseda juurde Panda funktsioonidele ja klassidele, kasutades eesliidet "pd".
import pandas as pd
2. Järgmiseks loome sõnastiku 'andmed', mis sisaldab mõningaid näidisandmeid. Iga sõnastiku klahv tähistab veeru nime ja sellele vastav väärtus on selle veeru väärtuste loend.
data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']}
3. Seejärel teisendame selle sõnastiku funktsiooni "pd.DataFrame()" kasutades Pandase DataFrame'i objektiks.
df = pd.DataFrame(data)
4. Lõpuks, uue veeru lisamiseks kasutame lihtsalt andmeraamiga määramisoperaatorit “=”, pakkudes nurksulgudes uue veeru nime ja määrates vaikeväärtuse. Meie puhul lisasime veeru "Riik" vaikeväärtusega "USA".
df['Country'] = 'USA'
Panda raamatukogu ja sellega seotud funktsioonid
Pandas on võimas Pythoni teek, mis sobib eriti hästi andmetöötlus-, puhastus- ja analüüsitoiminguteks. See pakub kahte peamist andmestruktuuri: DataFrame ja Seeria. DataFrame on kahemõõtmeline tabeliline andmestruktuur, millel on märgistatud teljed (read ja veerud). Seevastu seeria on ühemõõtmeline märgistatud massiiv, mis suudab hoida mis tahes tüüpi andmeid.
Mõned levinumad Panda funktsioonid, mis on seotud DataFrame'i veergude lisamise, muutmise ja kustutamisega, on järgmised.
- insert (): Veeru sisestamiseks määratud kohta.
- drop (): Veeru eemaldamiseks DataFrame'ist.
- rename (): DataFrame'i veeru ümbernimetamiseks.
- määra(): Uue veeru loomiseks avaldise tulemuse põhjal.
Seega on Panda DataFrame'i uue veeru lisamine lihtne ja tõhus. Selles artiklis oleme käsitlenud uue vaikeväärtusega veeru lisamise põhimeetodit ja andnud üksikasjalikud selgitused kaasnevate toimingute kohta. Oleme tutvustanud Pandasid ka võimsa andmetöötlusteekina ja arutanud mõningaid sellega seotud funktsioone DataFrame'i veergude haldamiseks. Neid tehnikaid valdades saate Pythonis hästi hakkama mitmesuguste andmetöötlustoimingutega.