Zgjidhur: shtoni kolona të shumta në kornizën e të dhënave nëse nuk ekzistojnë panda

Pandas është një bibliotekë Python me burim të hapur që ofron struktura të dhënash me performancë të lartë, të lehta për t'u përdorur dhe mjete të analizës së të dhënave. Është bërë një zgjedhje e preferuar për zhvilluesit dhe shkencëtarët e të dhënave kur bëhet fjalë për manipulimin dhe analizën e të dhënave. Një nga veçoritë e fuqishme të ofruara nga Pandas është krijimi dhe modifikimi i kornizave të të dhënave. Në këtë artikull, ne do të shqyrtojmë procesin e shtimit të kolonave të shumta në një kornizë të dhënash nëse ato nuk ekzistojnë, duke përdorur bibliotekën e pandave. Ne do të ecim përmes një shpjegimi hap pas hapi të kodit dhe do të zhytemi në funksionet, bibliotekat dhe problemet që mund të hasni gjatë rrugës.

Puna me kornizat e të dhënave është thelbësore gjatë trajtimit të të dhënave dhe shpesh mund të gjendeni në një situatë ku duhet të shtoni disa kolona menjëherë në një kornizë të dhënash. Kjo mund të jetë e ndërlikuar, por biblioteka e Pandas e bën këtë detyrë të qetë dhe efikase. Së pari, le të fillojmë duke importuar bibliotekën e Pandas:

import pandas as pd

Shtimi i shumë kolonave në kornizën e të dhënave të Pandas

Për të shtuar kolona të shumta në një kornizë të dhënash, mund të përdorim metodën DataFrame.assign(). Kjo metodë na lejon të shtojmë një ose disa kolona në kornizën e të dhënave menjëherë. Le të krijojmë një kampion të të dhënave dhe më pas të shtojmë disa kolona në të nëse ato nuk ekzistojnë tashmë:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

copë kodi më sipër, fillimisht krijojmë një kampion të të dhënave me dy kolona, ​​'kolona1' dhe 'kolona2'. Më pas krijojmë një listë me kolona të reja, 'kolona 3' dhe 'kolona 4', që duam t'i shtojmë kornizës së të dhënave. Së fundi, ne përsërisim listën e kolonave dhe shtojmë një kolonë të re nëse nuk ekziston tashmë në kornizën e të dhënave.

Shpjegim hap pas hapi

Këtu është një hap pas hapi shpjegimi i secilës pjesë e zgjidhjes sonë:

1. Fillojmë duke importuar bibliotekën e Pandas duke përdorur "import panda si pd".
2. Më pas, ne krijojmë një kampion të të dhënave të quajtur 'df' me dy kolona: 'kolona1' dhe 'kolona2'.
3. Ne krijojmë një listë me kolona të reja që duam t'i shtojmë kornizës së të dhënave – 'kolona3' dhe 'kolona4'.
4. Ne përdorim një cikli for për të përsëritur nëpër listën e kolonave të reja.
5. Brenda ciklit, ne kontrollojmë nëse kolona e re ekziston tashmë në kornizën e të dhënave duke përdorur kushtin 'not in'. Nëse kolona e re nuk ekziston, ne shtojmë kolonën e re në kornizën e të dhënave me një vlerë të paracaktuar prej Asnjë.

Funksionet dhe bibliotekat e pandave

Pandas ofron një gamë të gjerë funksionesh dhe metodash që thjeshtojnë trajtimin dhe manipulimin e kornizave të të dhënave. Në zgjidhjen tonë, ne kemi përdorur përbërësit kryesorë të mëposhtëm:

  • Korniza e të Dhënave – Si struktura primare e të dhënave në panda, DataFrame është një të dhënë tabelare dy-dimensionale, e ndryshueshme, potencialisht heterogjene me boshte të etiketuara (rreshta dhe kolona)
  • DataFrame.kolonat – Ky atribut kthen etiketat e kolonave të DataFrame, duke na lejuar të aksesojmë dhe të verifikojmë nëse një kolonë ekziston apo jo.
  • pd.DataFrame() – Është funksioni konstruktor për të krijuar një kornizë të re të dhënash. Kjo ju lejon të përcaktoni të dhënat dhe emrat e kolonave gjatë krijimit.

Tani që keni një kuptim më të mirë se si shtoni disa kolona për një kornizë të dhënash Pandas, kjo teknikë do t'ju ndihmojë të menaxhoni dhe manipuloni në mënyrë efikase të dhënat. Mos harroni se Pandas ofron shumë karakteristika të tjera të fuqishme për analizën dhe manipulimin e të dhënave, prandaj sigurohuni që t'i eksploroni ato gjithashtu për t'u bërë një zhvillues më efektiv i Python.

Mesazhe të ngjashme:

Lini një koment