Atrisināts: pievienojiet vairākas kolonnas datu rāmis, ja pandas neeksistē

Pandas ir atvērtā koda Python bibliotēka, kas nodrošina augstas veiktspējas, viegli lietojamas datu struktūras un datu analīzes rīkus. Tā ir kļuvusi par izstrādātāju un datu zinātnieku izvēli, kad runa ir par datu manipulācijām un analīzi. Viena no jaudīgajām Pandas piedāvātajām funkcijām ir datu rāmju izveide un modificēšana. Šajā rakstā mēs izpētīsim procesu, kā datu rāmim pievienot vairākas kolonnas, ja tās neeksistē, izmantojot pandas bibliotēku. Mēs detalizēti izskaidrosim kodu un iedziļināsimies saistītajās funkcijās, bibliotēkās un problēmās, ar kurām jūs varētu saskarties.

Darbs ar datu rāmjiem ir ļoti svarīgs, apstrādājot datus, un bieži vien jūs varat nonākt situācijā, kad datu kadram ir jāpievieno vairākas kolonnas vienlaikus. Tas var būt sarežģīti, taču Pandas bibliotēka padara šo uzdevumu gludu un efektīvu. Vispirms sāksim ar Pandas bibliotēkas importēšanu:

import pandas as pd

Vairāku kolonnu pievienošana Pandas datu rāmis

Lai datu rāmjam pievienotu vairākas kolonnas, mēs varam izmantot metodi DataFrame.assign(). Šī metode ļauj datu rāmim vienlaikus pievienot vienu vai vairākas kolonnas. Izveidosim datu rāmja paraugu un pēc tam pievienosim tam vairākas kolonnas, ja tās vēl nepastāv:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

Iekš koda fragments iepriekš, mēs vispirms izveidojam datu rāmja paraugu ar divām kolonnām — kolonna1 un kolonna 2. Pēc tam mēs izveidojam sarakstu ar jaunām kolonnām — 'column3' un 'column4', kuras vēlamies pievienot datu rāmi. Visbeidzot, mēs atkārtojam kolonnu sarakstu un pievienojam jaunu kolonnu, ja tā vēl nepastāv datu rāmī.

Paskaidrojums soli pa solim

Lūk, soli pa solim katras daļas skaidrojums no mūsu risinājuma:

1. Mēs sākam ar Pandas bibliotēkas importēšanu, izmantojot “import pandas as pd”.
2. Pēc tam mēs izveidojam datu rāmja paraugu ar nosaukumu “df” ar divām kolonnām: “column1” un “column2”.
3. Mēs izveidojam sarakstu ar jaunām kolonnām, kuras vēlamies pievienot datu rāmjam – 'column3' un 'column4'.
4. Mēs izmantojam for cilpu, lai atkārtotu jauno kolonnu sarakstu.
5. Cilpas ietvaros mēs pārbaudām, vai jaunā kolonna jau pastāv datu ietvarā, izmantojot nosacījumu “not in”. Ja jaunā kolonna nepastāv, mēs pievienojam jauno kolonnu datu rāmis ar noklusējuma vērtību Nav.

Pandas funkcijas un bibliotēkas

Pandas piedāvā plašu funkciju un metožu klāstu, kas vienkāršo datu kadru apstrādi un manipulācijas ar tiem. Savā risinājumā mēs izmantojām šādus galvenos komponentus:

  • DataFrame - Kā primārā datu struktūra pandām DataFrame ir divdimensiju, mainīgi, potenciāli neviendabīgi tabulu dati ar marķētām asīm (rindām un kolonnām).
  • DataFrame.columns – Šis atribūts atgriež DataFrame kolonnu etiķetes, ļaujot mums piekļūt un pārbaudīt, vai kolonna pastāv.
  • pd.DataFrame() – Tā ir konstruktora funkcija, lai izveidotu jaunu datu rāmi. Tas ļauj definēt datu un kolonnu nosaukumus izveides laikā.

Tagad, kad jums ir labāka izpratne par to, kā pievienot vairākas kolonnas Pandas datu rāmis, šis paņēmiens palīdzēs efektīvi pārvaldīt un manipulēt ar datiem. Atcerieties, ka Pandas piedāvā daudzas citas efektīvas iespējas datu analīzei un manipulācijām, tāpēc noteikti izpētiet arī tās, lai kļūtu par efektīvāku Python izstrādātāju.

Related posts:

Leave a Comment