Löst: lägg till ny kolumn i pandas dataram

I den här artikeln kommer vi att utforska processen att lägga till en ny kolumn till en Pandas DataFrame, ett populärt bibliotek i Python för datamanipulation och analys. Vi kommer att diskutera lösningen på detta problem, gå igenom en steg-för-steg-förklaring av koden och täcka några relaterade ämnen och funktioner i Pandas bibliotek. Pandas är ett allmänt använt bibliotek med datastrukturer och verktyg på hög nivå, perfekt för effektiv dataanalys och hantering av uppgifter.

Till att börja med, låt oss anta att vi har en datauppsättning i form av en Pandas DataFrame och vi vill lägga till en ny kolumn till den. Detta är ett vanligt krav i databeredningsstadiet, som ofta behövs för funktionsutveckling eller för att generera ytterligare information baserat på befintliga kolumner. Låt oss dyka in i hur detta kan uppnås.

Lägga till en ny kolumn i en Pandas DataFrame

Vi börjar med att importera det nödvändiga biblioteket och skapa ett exempel på DataFrame.

import pandas as pd

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

df = pd.DataFrame(data)

Låt oss nu lägga till en ny kolumn 'Land' till vår DataFrame med ett standardvärde, säg 'USA'.

df['Country'] = 'USA'

Denna enkla kodrad kommer att lägga till en ny kolumn med namnet 'Land' till vår befintliga DataFrame 'df' med värdet 'USA' i alla dess rader. Vår uppdaterade DataFrame skulle se ut så här:

  Name  Age     City Country
0  Alex   25      NY     USA
1   Tom   28      LA     USA
2  Nick   23      SF     USA
3   Sam   22  Chicago     USA

Steg-för-steg kodförklaring

Låt oss bryta ner koden och förstå den steg för steg.

1. Först importerar vi Pandas-biblioteket med standardaliaset 'pd'. Detta gör att vi kan komma åt Pandas funktioner och klasser med prefixet 'pd'.

import pandas as pd

2. Därefter skapar vi en ordbok 'data' som innehåller några exempeldata. Varje nyckel i ordboken representerar ett kolumnnamn, och dess motsvarande värde är en lista med värden för den kolumnen.

data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'],
        'Age': [25, 28, 23, 22],
        'City': ['NY', 'LA', 'SF', 'Chicago']}

3. Vi konverterar sedan denna ordbok till ett Pandas DataFrame-objekt med hjälp av funktionen `pd.DataFrame()`.

df = pd.DataFrame(data)

4. Slutligen, för att lägga till en ny kolumn använder vi helt enkelt tilldelningsoperatorn "=" med DataFrame, vilket ger det nya kolumnnamnet inom hakparenteser och anger standardvärdet. I vårt fall lade vi till kolumnen 'Land' med standardvärdet 'USA'.

df['Country'] = 'USA'

Pandas bibliotek och relaterade funktioner

Pandas är ett kraftfullt Python-bibliotek, särskilt lämpligt för databearbetning, rengöring och analysuppgifter. Den tillhandahåller två huvuddatastrukturer: DataFrame och Serier. En DataFrame är en tvådimensionell tabelldatastruktur med märkta axlar (rader och kolumner). En serie, å andra sidan, är en endimensionell märkt array som kan hålla data av vilken typ som helst.

Några vanliga Pandas-funktioner relaterade till att lägga till, ändra och ta bort kolumner i en DataFrame är följande:

  • Föra in(): För att infoga en kolumn på en angiven position.
  • släppa(): För att ta bort en kolumn från DataFrame.
  • Döp om(): För att byta namn på en DataFrames kolumn.
  • tilldela(): För att skapa en ny kolumn baserat på resultatet av ett uttryck.

Så det är enkelt och effektivt att lägga till en ny kolumn i en Pandas DataFrame. I den här artikeln har vi täckt den grundläggande metoden för att lägga till en ny kolumn med ett standardvärde och tillhandahållit detaljerade förklaringar för de inblandade stegen. Vi har också introducerat Pandas som ett kraftfullt datamanipuleringsbibliotek och diskuterat några relaterade funktioner för att hantera DataFrame-kolumner. Genom att behärska dessa tekniker kommer du att vara väl rustad att hantera ett brett utbud av databearbetningsuppgifter i Python.

Relaterade inlägg:

Lämna en kommentar