Atrisināts: pievienojiet jaunu kolonnu pandas datu rāmis

Šajā rakstā mēs izpētīsim jaunas kolonnas pievienošanas procesu Pandas DataFrame — populārai Python bibliotēkai datu manipulēšanai un analīzei. Mēs apspriedīsim šīs problēmas risinājumu, detalizēti izskaidrosim kodu un apskatīsim dažas saistītās tēmas un funkcijas Pandas bibliotēkā. Pandas ir plaši izmantota bibliotēka ar augsta līmeņa datu struktūrām un rīkiem, kas ir lieliski piemērota efektīvai datu analīzei un apstrādei.

Sākumā pieņemsim, ka mums ir datu kopa Pandas DataFrame formā, un mēs vēlamies tai pievienot jaunu kolonnu. Tā ir izplatīta prasība datu sagatavošanas posmā, kas bieži ir nepieciešama funkciju izstrādei vai papildu informācijas ģenerēšanai, pamatojoties uz esošajām kolonnām. Iedziļināsimies tajā, kā to var panākt.

Jaunas kolonnas pievienošana Pandas DataFrame

Sāksim ar vajadzīgās bibliotēkas importēšanu un DataFrame parauga izveidošanu.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Tagad pievienosim mūsu DataFrame jaunu kolonnu “Country” ar noklusējuma vērtību, piemēram, “ASV”.

df['Country'] = 'USA'

Šī vienkāršā koda rindiņa mūsu esošajam DataFrame 'df' pievienos jaunu kolonnu ar nosaukumu "Country" ar vērtību "USA" visās tā rindās. Mūsu atjauninātais DataFrame izskatītos šādi:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Soli pa solim koda skaidrojums

Sadalīsim kodu un sapratīsim to soli pa solim.

1. Pirmkārt, mēs importējam Pandas bibliotēku, izmantojot standarta aizstājvārdu "pd". Tas ļauj mums piekļūt Pandas funkcijām un klasēm, izmantojot prefiksu "pd".

import pandas as pd

2. Pēc tam mēs izveidojam vārdnīcu “dati”, kas satur dažus datu paraugus. Katra atslēga vārdnīcā apzīmē kolonnas nosaukumu, un tai atbilstošā vērtība ir šīs kolonnas vērtību saraksts.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Pēc tam mēs pārveidojam šo vārdnīcu par Pandas DataFrame objektu, izmantojot funkciju "pd.DataFrame()".

df = pd.DataFrame(data)

4. Visbeidzot, lai pievienotu jaunu kolonnu, mēs vienkārši izmantojam piešķiršanas operatoru “=” kopā ar DataFrame, norādot jauno kolonnas nosaukumu kvadrātiekavās un norādot noklusējuma vērtību. Mūsu gadījumā mēs pievienojām kolonnu "Valsts" ar noklusējuma vērtību "ASV".

df['Country'] = 'USA'

Pandas bibliotēka un ar to saistītās funkcijas

Pandas ir jaudīga Python bibliotēka, kas īpaši piemērota datu apstrādes, tīrīšanas un analīzes uzdevumiem. Tas nodrošina divas galvenās datu struktūras: DataFrame un Sērija. DataFrame ir divdimensiju tabulas datu struktūra ar marķētām asīm (rindām un kolonnām). No otras puses, sērija ir viendimensijas marķēts masīvs, kas spēj glabāt jebkura veida datus.

Dažas izplatītākās Pandas funkcijas, kas saistītas ar kolonnu pievienošanu, modificēšanu un dzēšanu DataFrame, ir šādas:

  • ievietot (): Lai ievietotu kolonnu noteiktā vietā.
  • piliens (): Lai noņemtu kolonnu no DataFrame.
  • pārdēvēt (): Lai pārdēvētu DataFrame kolonnu.
  • piešķirt (): Lai izveidotu jaunu kolonnu, pamatojoties uz izteiksmes rezultātu.

Tātad jaunas kolonnas pievienošana Pandas DataFrame ir vienkārša un efektīva. Šajā rakstā mēs esam apskatījuši jaunas kolonnas pievienošanas pamatmetodi ar noklusējuma vērtību un snieguši detalizētus skaidrojumus par saistītajām darbībām. Mēs esam arī ieviesuši Pandas kā jaudīgu datu manipulācijas bibliotēku un apspriedām dažas saistītās funkcijas DataFrame kolonnu pārvaldīšanai. Apgūstot šīs metodes, jūs būsiet labi sagatavots, lai Python apstrādātu plašu datu apstrādes uzdevumu klāstu.

Related posts:

Leave a Comment