Pandas je Python biblioteka otvorenog koda koja pruža strukture podataka visokih performansi, jednostavne za korištenje i alate za analizu podataka. Postao je izbor za programere i naučnike kada su u pitanju manipulacija i analiza podataka. Jedna od moćnih funkcija koje pruža Pandas je kreiranje i modifikacija okvira podataka. U ovom članku ćemo istražiti proces dodavanja više kolona u okvir podataka ako ne postoje, koristeći pandas biblioteku. Proći ćemo kroz objašnjenje koda korak po korak i zaroniti u povezane funkcije, biblioteke i probleme na koje možete naići na tom putu.
Rad sa okvirima podataka je ključan prilikom rukovanja podacima i često se možete naći u situaciji da morate dodati više kolona odjednom u okvir podataka. Ovo može biti nezgodno, ali Pandas biblioteka čini ovaj zadatak glatkim i efikasnim. Prvo, počnimo s uvozom Pandas biblioteke:
import pandas as pd
Dodavanje više kolona u Pandas Dataframe
Da bismo dodali više kolona u okvir podataka, možemo koristiti metodu DataFrame.assign(). Ova metoda nam omogućava da dodamo jednu ili više kolona u okvir podataka odjednom. Kreirajmo uzorak okvira podataka i dodajmo mu više stupaca ako već ne postoje:
# Create a sample dataframe data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]} df = pd.DataFrame(data) # Add multiple columns if they do not exist new_columns = ['column3', 'column4'] for new_col in new_columns: if new_col not in df.columns: df[new_col] = None
U isječak koda iznad, prvo kreiramo uzorak okvira podataka sa dvije kolone, 'kolona1' i 'kolona2'. Zatim kreiramo listu novih kolona, 'kolona3' i 'kolona4', koje želimo da dodamo okviru podataka. Konačno, ponavljamo kroz listu kolona i dodajemo novu kolonu ako već ne postoji u okviru podataka.
Objašnjenje korak po korak
Evo korak po korak objašnjenje svakog dijela našeg rješenja:
1. Počinjemo uvozom Pandas biblioteke koristeći “import pandas as pd”.
2. Zatim kreiramo ogledni okvir podataka nazvan 'df' sa dvije kolone: 'kolona1' i 'kolona2'.
3. Kreiramo listu novih kolona koje želimo dodati u okvir podataka – 'kolona3' i 'kolona4'.
4. Koristimo for petlju za ponavljanje kroz listu novih kolona.
5. Unutar petlje provjeravamo da li nova kolona već postoji u okviru podataka koristeći uvjet 'nije u'. Ako nova kolona ne postoji, dodajemo novu kolonu u okvir podataka sa zadanom vrijednošću None.
Pandas funkcije i biblioteke
Pandas nudi širok spektar funkcija i metoda koje pojednostavljuju rukovanje i manipulaciju okvirima podataka. U našem rješenju koristili smo sljedeće ključne komponente:
- DataFrame – Kao primarna struktura podataka u pandama, DataFrame je dvodimenzionalni, promjenjivi, potencijalno heterogeni tabelarni podaci s označenim osama (redovi i stupci)
- DataFrame.columns – Ovaj atribut vraća oznake stupaca DataFramea, omogućavajući nam da pristupimo i provjerimo postoji li kolona ili ne.
- pd.DataFrame() – To je funkcija konstruktora za kreiranje novog okvira podataka. Omogućava vam da definirate nazive podataka i stupaca tokom kreiranja.
Sada kada ste bolje razumjeli kako dodajte više kolona za Pandas dataframe, ova tehnika će vam pomoći da efikasno upravljate podacima i manipulišete njima. Imajte na umu da Pandas nudi brojne druge moćne funkcije za analizu podataka i manipulaciju, pa svakako istražite i njih kako biste postali učinkovitiji Python programer.