Išspręsta: pridėti naują stulpelį į pandų duomenų rėmelį

Šiame straipsnyje mes išnagrinėsime naujo stulpelio įtraukimo į Pandas DataFrame, populiarios Python bibliotekos, skirtos duomenų apdorojimui ir analizei, procesą. Aptarsime šios problemos sprendimą, žingsnis po žingsnio paaiškinsime kodą ir apžvelgsime kai kurias susijusias temas ir funkcijas Pandas bibliotekoje. Pandas yra plačiai naudojama biblioteka, turinti aukšto lygio duomenų struktūras ir įrankius, puikiai tinkanti efektyviai duomenų analizei ir tvarkymo užduotims atlikti.

Pirmiausia tarkime, kad turime duomenų rinkinį Pandas DataFrame pavidalu ir norime prie jo pridėti naują stulpelį. Tai įprastas reikalavimas duomenų rengimo etape, dažnai reikalingas funkcijų inžinerijai arba papildomos informacijos generavimui pagal esamus stulpelius. Pasinerkime į tai, kaip tai galima pasiekti.

Naujo stulpelio įtraukimas į Pandas DataFrame

Pradėsime importuodami reikiamą biblioteką ir sukursime pavyzdį „DataFrame“.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Dabar į savo duomenų rėmelį įtraukkime naują stulpelį „Šalis“ su numatytąją reikšme, tarkime „JAV“.

df['Country'] = 'USA'

Ši paprasta kodo eilutė pridės naują stulpelį pavadinimu „Country“ prie esamo „DataFrame“ „df“ su reikšme „USA“ visose jo eilutėse. Mūsų atnaujintas DataFrame atrodytų taip:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Žingsnis po žingsnio kodo paaiškinimas

Suskaidykime kodą ir supraskime jį žingsnis po žingsnio.

1. Pirma, mes importuojame Pandas biblioteką naudodami standartinį slapyvardį „pd“. Tai leidžia mums pasiekti Pandas funkcijas ir klases naudojant „pd“ priešdėlį.

import pandas as pd

2. Tada sukuriame žodyną „duomenys“, kuriame yra keletas pavyzdinių duomenų. Kiekvienas raktas žodyne reiškia stulpelio pavadinimą, o atitinkama jo reikšmė yra to stulpelio reikšmių sąrašas.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Tada konvertuojame šį žodyną į Pandas DataFrame objektą, naudodami funkciją „pd.DataFrame()“.

df = pd.DataFrame(data)

4. Galiausiai, norėdami pridėti naują stulpelį, tiesiog naudojame priskyrimo operatorių „=“ su DataFrame, pateikdami naują stulpelio pavadinimą laužtiniuose skliaustuose ir nurodydami numatytąją reikšmę. Mūsų atveju stulpelį „Šalis“ įtraukėme su numatytąją reikšme „JAV“.

df['Country'] = 'USA'

Pandos biblioteka ir susijusios funkcijos

Pandas yra galinga Python biblioteka, ypač tinkama duomenų apdorojimo, valymo ir analizės užduotims. Jame pateikiamos dvi pagrindinės duomenų struktūros: DataFrame ir serija. DataFrame yra dvimatė lentelės formos duomenų struktūra su pažymėtomis ašimis (eilelėmis ir stulpeliais). Kita vertus, serija yra vienmatis pažymėtas masyvas, galintis laikyti bet kokio tipo duomenis.

Kai kurios įprastos Pandas funkcijos, susijusios su stulpelių pridėjimu, keitimu ir ištrynimu DataFrame, yra šios:

  • Įdėti(): Norėdami įterpti stulpelį nurodytoje vietoje.
  • lašas (): Norėdami pašalinti stulpelį iš DataFrame.
  • pervardyti (): Norėdami pervardyti DataFrame stulpelį.
  • priskirti (): Norėdami sukurti naują stulpelį pagal išraiškos rezultatą.

Taigi, naujo stulpelio pridėjimas prie Pandas DataFrame yra paprastas ir efektyvus. Šiame straipsnyje aptarėme pagrindinį metodą, kaip pridėti naują stulpelį su numatytąją reikšme, ir pateikėme išsamius susijusių veiksmų paaiškinimus. Taip pat pristatėme Pandas kaip galingą duomenų apdorojimo biblioteką ir aptarėme kai kurias susijusias DataFrame stulpelių valdymo funkcijas. Įvaldę šiuos metodus, būsite gerai pasirengę atlikti įvairias duomenų apdorojimo užduotis Python.

Susijusios naujienos:

Palikite komentarą