Opgelost: nieuwe kolom toevoegen aan pandas-dataframe

In dit artikel zullen we het proces verkennen van het toevoegen van een nieuwe kolom aan een Pandas DataFrame, een populaire bibliotheek in Python voor gegevensmanipulatie en -analyse. We zullen de oplossing voor dit probleem bespreken, een stapsgewijze uitleg van de code doornemen en een aantal gerelateerde onderwerpen en functies in de Pandas-bibliotheek behandelen. Pandas is een veelgebruikte bibliotheek met datastructuren en tools op hoog niveau, perfect voor efficiënte data-analyse en afhandelingstaken.

Laten we om te beginnen aannemen dat we een dataset hebben in de vorm van een Pandas DataFrame en dat we er een nieuwe kolom aan willen toevoegen. Dit is een algemene vereiste in de fase van gegevensvoorbereiding, die vaak nodig is voor feature-engineering of om aanvullende informatie te genereren op basis van bestaande kolommen. Laten we eens kijken hoe dit kan worden bereikt.

Een nieuwe kolom toevoegen aan een Pandas DataFrame

We beginnen met het importeren van de vereiste bibliotheek en het maken van een voorbeeld DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Laten we nu een nieuwe kolom 'Land' toevoegen aan ons DataFrame met een standaardwaarde, bijvoorbeeld 'VS'.

df['Country'] = 'USA'

Deze eenvoudige regel code voegt een nieuwe kolom met de naam 'Country' toe aan ons bestaande DataFrame 'df' met de waarde 'USA' in alle rijen. Ons bijgewerkte DataFrame zou er als volgt uitzien:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Stapsgewijze code-uitleg

Laten we de code opsplitsen en stap voor stap begrijpen.

1. Eerst importeren we de Pandas-bibliotheek met de standaardalias 'pd'. Hierdoor hebben we toegang tot functies en klassen van Panda's met behulp van het voorvoegsel 'pd'.

import pandas as pd

2. Vervolgens maken we een woordenboek 'data' met enkele voorbeeldgegevens. Elke sleutel in het woordenboek vertegenwoordigt een kolomnaam en de bijbehorende waarde is een lijst met waarden voor die kolom.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Vervolgens zetten we dit woordenboek om in een Pandas DataFrame-object met behulp van de functie `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Ten slotte, om een ​​nieuwe kolom toe te voegen, gebruiken we gewoon de toewijzingsoperator "=" met het DataFrame, waarbij we de nieuwe kolomnaam tussen vierkante haken plaatsen en de standaardwaarde specificeren. In ons geval hebben we de kolom 'Land' toegevoegd met de standaardwaarde 'VS'.

df['Country'] = 'USA'

Panda's-bibliotheek en gerelateerde functies

Pandas is een krachtige Python-bibliotheek, met name geschikt voor gegevensverwerking, opschoning en analysetaken. Het biedt twee belangrijke gegevensstructuren: dataframe en -Series. Een DataFrame is een tweedimensionale gegevensstructuur in tabelvorm met gelabelde assen (rijen en kolommen). Een serie daarentegen is een eendimensionale gelabelde array die gegevens van elk type kan bevatten.

Enkele algemene Panda-functies met betrekking tot het toevoegen, wijzigen en verwijderen van kolommen in een DataFrame zijn als volgt:

  • invoegen(): Een kolom invoegen op een opgegeven positie.
  • druppel(): Om een ​​kolom uit het DataFrame te verwijderen.
  • hernoemen(): De naam van een DataFrame-kolom wijzigen.
  • toewijzen(): Een nieuwe kolom maken op basis van het resultaat van een uitdrukking.

Het toevoegen van een nieuwe kolom aan een Pandas DataFrame is dus eenvoudig en efficiënt. In dit artikel hebben we de basismethode behandeld voor het toevoegen van een nieuwe kolom met een standaardwaarde en hebben we gedetailleerde uitleg gegeven voor de betrokken stappen. We hebben ook Panda's geïntroduceerd als een krachtige bibliotheek voor gegevensmanipulatie en hebben enkele gerelateerde functies besproken voor het beheren van DataFrame-kolommen. Door deze technieken onder de knie te krijgen, ben je goed toegerust om een ​​breed scala aan gegevensverwerkingstaken in Python aan te kunnen.

Gerelateerde berichten:

Laat een bericht achter