Riješeno: dodajte više kolona u okvir podataka ako ne postoje pandas

Pandas je Python biblioteka otvorenog koda koja pruža strukture podataka visokih performansi, jednostavne za korištenje i alate za analizu podataka. Postao je izbor za programere i naučnike kada su u pitanju manipulacija i analiza podataka. Jedna od moćnih funkcija koje pruža Pandas je kreiranje i modifikacija okvira podataka. U ovom članku ćemo istražiti proces dodavanja više kolona u okvir podataka ako ne postoje, koristeći pandas biblioteku. Proći ćemo kroz objašnjenje koda korak po korak i zaroniti u povezane funkcije, biblioteke i probleme na koje možete naići na tom putu.

Rad sa okvirima podataka je ključan prilikom rukovanja podacima i često se možete naći u situaciji da morate dodati više kolona odjednom u okvir podataka. Ovo može biti nezgodno, ali Pandas biblioteka čini ovaj zadatak glatkim i efikasnim. Prvo, počnimo s uvozom Pandas biblioteke:

import pandas as pd

Dodavanje više kolona u Pandas Dataframe

Da bismo dodali više kolona u okvir podataka, možemo koristiti metodu DataFrame.assign(). Ova metoda nam omogućava da dodamo jednu ili više kolona u okvir podataka odjednom. Kreirajmo uzorak okvira podataka i dodajmo mu više stupaca ako već ne postoje:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

U isječak koda iznad, prvo kreiramo uzorak okvira podataka sa dvije kolone, 'kolona1' i 'kolona2'. Zatim kreiramo listu novih kolona, ​​'kolona3' i 'kolona4', koje želimo da dodamo okviru podataka. Konačno, ponavljamo kroz listu kolona i dodajemo novu kolonu ako već ne postoji u okviru podataka.

Objašnjenje korak po korak

Evo korak po korak objašnjenje svakog dijela našeg rješenja:

1. Počinjemo uvozom Pandas biblioteke koristeći “import pandas as pd”.
2. Zatim kreiramo ogledni okvir podataka nazvan 'df' sa dvije kolone: ​​'kolona1' i 'kolona2'.
3. Kreiramo listu novih kolona koje želimo dodati u okvir podataka – 'kolona3' i 'kolona4'.
4. Koristimo for petlju za ponavljanje kroz listu novih kolona.
5. Unutar petlje provjeravamo da li nova kolona već postoji u okviru podataka koristeći uvjet 'nije u'. Ako nova kolona ne postoji, dodajemo novu kolonu u okvir podataka sa zadanom vrijednošću None.

Pandas funkcije i biblioteke

Pandas nudi širok spektar funkcija i metoda koje pojednostavljuju rukovanje i manipulaciju okvirima podataka. U našem rješenju koristili smo sljedeće ključne komponente:

  • DataFrame – Kao primarna struktura podataka u pandama, DataFrame je dvodimenzionalni, promjenjivi, potencijalno heterogeni tabelarni podaci s označenim osama (redovi i stupci)
  • DataFrame.columns – Ovaj atribut vraća oznake stupaca DataFramea, omogućavajući nam da pristupimo i provjerimo postoji li kolona ili ne.
  • pd.DataFrame() – To je funkcija konstruktora za kreiranje novog okvira podataka. Omogućava vam da definirate nazive podataka i stupaca tokom kreiranja.

Sada kada ste bolje razumjeli kako dodajte više kolona za Pandas dataframe, ova tehnika će vam pomoći da efikasno upravljate podacima i manipulišete njima. Imajte na umu da Pandas nudi brojne druge moćne funkcije za analizu podataka i manipulaciju, pa svakako istražite i njih kako biste postali učinkovitiji Python programer.

Slični postovi:

Ostavite komentar