Opgelost: hoe woord naar getal te converteren in python panda's

In de wereld van vandaag zijn gegevensmanipulatie en -analyse een cruciaal onderdeel geworden van verschillende industrieën. Een dergelijke taak die vaak voorkomt, is het converteren van woorden naar getallen in datasets. Dit artikel bespreekt hoe de krachtige bibliotheek van Python, panda's, kan worden gebruikt om deze taak efficiënt uit te voeren. We zullen de stappen, code en concepten verkennen die betrokken zijn bij het oplossen van dit probleem, zodat u het proces begrijpt en het gemakkelijk kunt implementeren.

Laten we om te beginnen het probleem begrijpen dat we willen oplossen. Stel je voor dat je een dataset hebt met een kolom met getallen geschreven in woorden, zoals 'een', 'twee', 'drie', enzovoort. Ons doel is om deze woordnummers om te zetten in hun integere tegenhangers met behulp van Python en panda's.

Stap 1: De benodigde bibliotheken importeren
Om deze taak te volbrengen, moeten we eerst de vereiste bibliotheken importeren. In dit geval gebruiken we de panda-bibliotheek voor het verwerken en manipuleren van de gegevens, en verbuigen voor het converteren van woorden naar getallen.

import pandas as pd
import inflect

panda's bibliotheek

pandas is een open-source bibliotheek voor gegevensmanipulatie en -analyse die gegevensstructuren en -functies biedt die nodig zijn voor het verwerken van gestructureerde gegevens. Het is gebouwd bovenop de programmeertaal Python en speelt een belangrijke rol bij het voorbewerken, opschonen en analyseren van gegevens. Enkele van de belangrijkste gegevensstructuren zijn Series, DataFrame en Index, die helpen bij het omgaan met verschillende gegevenstypen en bewerkingen.

bibliotheek verbuigen

verbuigen is een Python-bibliotheek die helpt bij het berekenen van meervouden en enkelvoudige zelfstandige naamwoorden, rangtelwoorden en het converteren van getallen naar woorden of woorden naar getallen. In dit artikel zullen we ons concentreren op het vermogen om woorden in getallen om te zetten. Om inflect te gebruiken, moet u het installeren met behulp van de volgende opdracht:

!pip install inflect

Stap 2: een panda-dataframe maken
Nu we de vereiste bibliotheken hebben geïmporteerd, gaan we een Panda DataFrame maken met een kolom met getallen als woorden. Dit zal dienen als onze voorbeelddataset ter illustratie.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Stap 3: Woorden omzetten in cijfers
Vervolgens zullen we de verbuigingsbibliotheek gebruiken om de getallen in woorden om te zetten in hun gehele tegenhangers. We zullen een functie maken met de naam 'convert_word_to_number' die een woord als invoer neemt en het bijbehorende getal retourneert.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

In dit codefragment definiëren we een functie die de inflect-engine gebruikt om woorden in getallen om te zetten. Vervolgens gebruiken we de methode pandas apply() om deze functie toe te passen op elk element van de kolom 'Numbers_in_words' in het DataFrame.

Kortom, we hebben gezien hoe Python, panda's en inflect kunnen worden gebruikt om woorden om te zetten in getallen in een dataset. Panda's dienen als een essentieel hulpmiddel voor gegevensmanipulatie, terwijl de verbuigingsbibliotheek helpt bij bewerkingen met woorden en cijfers. Door deze stappen te volgen, kunt u eenvoudig woordnummers converteren naar gehele getallen in uw datasets en uw gegevens verder analyseren en manipuleren. Veel codeerplezier!

Gerelateerde berichten:

Laat een bericht achter