Løst: hvordan konvertere ord til tall i python pandaer

I dagens verden har datamanipulering og analyse blitt en avgjørende del av ulike bransjer. En slik oppgave som ofte forekommer er å konvertere ord til tall i datasett. Denne artikkelen vil diskutere hvordan Pythons kraftige bibliotek, pandaer, kan brukes til å utføre denne oppgaven effektivt. Vi vil utforske trinnene, koden og konseptene som er involvert i å løse dette problemet, for å sikre at du forstår prosessen og kan implementere den enkelt.

Til å begynne med, la oss forstå problemet vi tar sikte på å løse. Tenk deg at du har et datasett med en kolonne som inneholder tall skrevet med ord, for eksempel «en», «to», «tre» og så videre. Målet vårt er å konvertere disse ordtallene til deres heltallsmotstykker ved å bruke Python og pandaer.

Trinn 1: Importere de nødvendige bibliotekene
For å utføre denne oppgaven må vi først importere de nødvendige bibliotekene. I dette tilfellet vil vi bruke pandas-biblioteket for å håndtere og manipulere dataene, og bøyes for å konvertere ord til tall.

import pandas as pd
import inflect

pandas bibliotek

pandas er et åpen kildekode-datamanipulerings- og analysebibliotek som gir datastrukturer og funksjoner som kreves for å håndtere strukturerte data. Det er bygget på toppen av programmeringsspråket Python og spiller en betydelig rolle i dataforbehandling, rengjøring og analyse. Noen av hoveddatastrukturene inkluderer Series, DataFrame og Index, som hjelper til med å håndtere ulike datatyper og operasjoner.

bøye biblioteket

inflect er et Python-bibliotek som hjelper til med å beregne flertall og entallssubstantiv, ordinaler og konvertere tall til ord eller ord til tall. I denne artikkelen vil vi fokusere på dens evne til å konvertere ord til tall. For å bruke bøying, må du installere den ved å bruke følgende kommando:

!pip install inflect

Trinn 2: Opprette en pandas DataFrame
Nå som vi har importert de nødvendige bibliotekene, la oss lage en pandas DataFrame med en kolonne som inneholder tall som ord. Dette vil tjene som vårt eksempeldatasett for illustrasjonsformål.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Trinn 3: Konvertering av ord til tall
Deretter vil vi bruke bøyningsbiblioteket til å konvertere tallene i ord til deres heltallsmotstykker. Vi vil lage en funksjon kalt 'konverter_ord_til_nummer' som tar et ord som input og returnerer det tilsvarende tallet.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

I denne kodebiten definerer vi en funksjon som bruker bøyningsmotoren til å konvertere ord til tall. Vi bruker deretter pandas application()-metoden for å bruke denne funksjonen på hvert element i 'Numbers_in_words'-kolonnen i DataFrame.

For å oppsummere har vi sett hvordan Python, pandaer og bøying kan brukes til å konvertere ord til tall i et datasett. Pandas fungerer som et viktig verktøy for datamanipulering, mens bøyningsbiblioteket hjelper til med operasjoner som involverer ord og tall. Ved å følge disse trinnene kan du enkelt konvertere ordtall til heltall i datasettene dine og videre analysere og manipulere dataene dine. Lykke til med koding!

Relaterte innlegg:

Legg igjen en kommentar