Löst: hur man konverterar ord till tal i python pandas

I dagens värld har datamanipulation och analys blivit en avgörande del av olika branscher. En sådan uppgift som ofta förekommer är att konvertera ord till siffror i datamängder. Den här artikeln kommer att diskutera hur Pythons kraftfulla bibliotek, pandor, kan användas för att utföra denna uppgift effektivt. Vi kommer att utforska stegen, koden och koncepten som är involverade i att lösa det här problemet, för att säkerställa att du förstår processen och kan implementera den enkelt.

Till att börja med, låt oss förstå problemet vi strävar efter att lösa. Föreställ dig att du har en datauppsättning med en kolumn som innehåller siffror skrivna i ord, som "en", "två", "tre" och så vidare. Vårt mål är att konvertera dessa ordnummer till deras heltalsmotsvarigheter med Python och pandor.

Steg 1: Importera nödvändiga bibliotek
För att utföra denna uppgift måste vi först importera de nödvändiga biblioteken. I det här fallet kommer vi att använda pandasbiblioteket för att hantera och manipulera data, och böja för att konvertera ord till siffror.

import pandas as pd
import inflect

pandas bibliotek

pandas är ett datamanipulerings- och analysbibliotek med öppen källkod som tillhandahåller datastrukturer och funktioner som krävs för att hantera strukturerad data. Det är byggt ovanpå programmeringsspråket Python och spelar en betydande roll vid förbearbetning, rengöring och analys av data. Några av dess huvudsakliga datastrukturer inkluderar Series, DataFrame och Index, som hjälper till att hantera olika datatyper och operationer.

böja bibliotek

inflect är ett Python-bibliotek som hjälper till att beräkna plural- och singularsubstantiv, ordinaler och konvertera siffror till ord eller ord till siffror. I den här artikeln kommer vi att fokusera på dess förmåga att konvertera ord till siffror. För att använda böja måste du installera det med följande kommando:

!pip install inflect

Steg 2: Skapa en pandas DataFrame
Nu när vi har importerat de nödvändiga biblioteken, låt oss skapa en pandas DataFrame med en kolumn som innehåller siffror som ord. Detta kommer att fungera som vårt exempeldataset för illustrationsändamål.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Steg 3: Konvertera ord till siffror
Därefter kommer vi att använda inflect-biblioteket för att konvertera talen i ord till deras heltalsmotsvarigheter. Vi kommer att skapa en funktion som heter 'konvertera_ord_till_nummer' som tar ett ord som indata och returnerar motsvarande tal.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

I det här kodavsnittet definierar vi en funktion som använder inflexmotorn för att konvertera ord till siffror. Vi använder sedan metoden pandas application() för att tillämpa den här funktionen på varje element i kolumnen 'Numbers_in_words' i DataFrame.

För att sammanfatta har vi sett hur Python, pandor och inflect kan användas för att konvertera ord till siffror i en datauppsättning. Pandas fungerar som ett väsentligt verktyg för datamanipulation, medan inflect-biblioteket hjälper till med operationer som involverar ord och siffror. Genom att följa dessa steg kan du enkelt konvertera ordnummer till heltal i dina datauppsättningar och ytterligare analysera och manipulera dina data. Glad kodning!

Relaterade inlägg:

Lämna en kommentar