Løst: hvordan man konverterer ord til tal i python pandaer

I dagens verden er datamanipulation og -analyse blevet en afgørende del af forskellige industrier. En sådan opgave, der ofte opstår, er at konvertere ord til tal i datasæt. Denne artikel vil diskutere, hvordan Pythons kraftfulde bibliotek, pandaer, kan bruges til at udføre denne opgave effektivt. Vi vil udforske de trin, kode og koncepter, der er involveret i at løse dette problem, og sikre, at du forstår processen og nemt kan implementere den.

Til at begynde med, lad os forstå det problem, vi sigter efter at løse. Forestil dig, at du har et datasæt med en kolonne, der indeholder tal skrevet med ord, såsom "en", "to", "tre" og så videre. Vores mål er at konvertere disse ordnumre til deres heltallige modstykker ved hjælp af Python og pandaer.

Trin 1: Import af de nødvendige biblioteker
For at udføre denne opgave skal vi først importere de nødvendige biblioteker. I dette tilfælde vil vi bruge pandas-biblioteket til at håndtere og manipulere dataene og bøje til at konvertere ord til tal.

import pandas as pd
import inflect

pandas bibliotek

pandas er et open source-datamanipulations- og analysebibliotek, der leverer datastrukturer og funktioner, der kræves til håndtering af strukturerede data. Det er bygget oven på Python-programmeringssproget og spiller en væsentlig rolle i dataforbehandling, -rensning og -analyse. Nogle af dens vigtigste datastrukturer inkluderer Series, DataFrame og Index, som hjælper med at håndtere forskellige datatyper og operationer.

bøje bibliotek

inflect er et Python-bibliotek, der hjælper med at beregne flertalsformer og entalsnavneord, ordinaler og konvertere tal til ord eller ord til tal. I denne artikel vil vi fokusere på dens evne til at konvertere ord til tal. For at bruge bøjning skal du installere det ved hjælp af følgende kommando:

!pip install inflect

Trin 2: Oprettelse af en pandas DataFrame
Nu hvor vi har importeret de nødvendige biblioteker, lad os skabe en pandas DataFrame med en kolonne, der indeholder tal som ord. Dette vil tjene som vores eksempeldatasæt til illustrationsformål.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Trin 3: Konvertering af ord til tal
Dernæst vil vi bruge bøjningsbiblioteket til at konvertere tallene i ord til deres heltallige modstykker. Vi vil oprette en funktion kaldet 'konverter_ord_til_tal', der tager et ord som input og returnerer det tilsvarende tal.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

I dette kodestykke definerer vi en funktion, der bruger inflect-motoren til at konvertere ord til tal. Vi bruger derefter pandas application()-metoden til at anvende denne funktion på hvert element i kolonnen 'Numbers_in_words' i DataFrame.

For at opsummere har vi set, hvordan Python, pandaer og bøjning kan bruges til at konvertere ord til tal i et datasæt. Pandas fungerer som et vigtigt værktøj til datamanipulation, mens bøjningsbiblioteket hjælper med operationer, der involverer ord og tal. Ved at følge disse trin kan du nemt konvertere ordnumre til heltal i dine datasæt og yderligere analysere og manipulere dine data. Glad kodning!

Relaterede indlæg:

Efterlad en kommentar