Solucionat: afegiu diverses columnes al marc de dades si no existeixen pandes

Pandas és una biblioteca Python de codi obert que proporciona estructures de dades d'alt rendiment i fàcils d'utilitzar i eines d'anàlisi de dades. S'ha convertit en una opció preferida per a desenvolupadors i científics de dades quan es tracta de manipulació i anàlisi de dades. Una de les potents funcions que ofereix Pandas és crear i modificar marcs de dades. En aquest article, explorarem el procés d'afegir diverses columnes a un marc de dades si no existeixen, mitjançant la biblioteca pandas. Passarem per una explicació pas a pas del codi i ens endinsarem en les funcions, biblioteques i problemes relacionats que us podríeu trobar al llarg del camí.

Treballar amb marcs de dades és crucial a l'hora de manejar dades, i sovint us podeu trobar en una situació en què necessiteu afegir diverses columnes alhora a un marc de dades. Això pot ser complicat, però la biblioteca Pandas fa que aquesta tasca sigui fàcil i eficient. Primer, comencem per importar la biblioteca Pandas:

import pandas as pd

Afegir diverses columnes a Pandas Dataframe

Per afegir diverses columnes a un marc de dades, podem utilitzar el mètode DataFrame.assign(). Aquest mètode ens permet afegir una o diverses columnes al marc de dades alhora. Creem un marc de dades de mostra i, a continuació, afegim diverses columnes si encara no existeixen:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

A la fragment de codi anterior, primer creem un marc de dades de mostra amb dues columnes, "column1" i "column2". Aleshores creem una llista de columnes noves, 'column3' i 'column4', que volem afegir al marc de dades. Finalment, iterem per la llista de columnes i afegim una nova columna si encara no existeix al dataframe.

Explicació pas a pas

Aquí teniu un pas a pas explicació de cada part de la nostra solució:

1. Comencem per importar la biblioteca Pandas amb “import pandas as pd”.
2. A continuació, creem un marc de dades de mostra anomenat "df" amb dues columnes: "column1" i "column2".
3. Creem una llista de columnes noves que volem afegir al marc de dades: 'column3' i 'column4'.
4. Utilitzem un bucle for per iterar per la llista de columnes noves.
5. Dins del bucle, comprovem si la nova columna ja existeix al marc de dades utilitzant la condició "no en". Si la columna nova no existeix, afegim la nova columna al marc de dades amb un valor predeterminat de Cap.

Funcions i Biblioteques Pandas

Pandas ofereix una àmplia gamma de funcions i mètodes que simplifiquen el maneig i la manipulació de marcs de dades. A la nostra solució, hem utilitzat els components clau següents:

  • DataFrame – Com a estructura de dades primària en pandes, DataFrame és una informació tabular bidimensional, mutable i potencialment heterogènia amb eixos etiquetats (files i columnes)
  • DataFrame.columns – Aquest atribut retorna les etiquetes de columna del DataFrame, que ens permet accedir i verificar si existeix una columna o no.
  • pd.DataFrame() – És la funció de constructor per crear un nou marc de dades. Us permet definir les dades i els noms de les columnes durant la creació.

Ara que tens una millor comprensió de com fer-ho afegir diverses columnes a un marc de dades de Pandas, aquesta tècnica us ajudarà a gestionar i manipular les dades de manera eficient. Recordeu que Pandas ofereix moltes altres funcions potents per a l'anàlisi i la manipulació de dades, així que assegureu-vos d'explorar-les també per convertir-vos en un desenvolupador de Python més eficaç.

Articles Relacionats:

Deixa el teu comentari