Gelöst: wie man Wort in Zahl in Python-Pandas umwandelt

In der heutigen Welt sind Datenmanipulation und -analyse zu einem entscheidenden Bestandteil verschiedener Branchen geworden. Eine solche Aufgabe, die häufig auftritt, ist das Konvertieren von Wörtern in Zahlen in Datensätzen. In diesem Artikel wird erläutert, wie Pandas, die leistungsstarke Bibliothek von Python, verwendet werden kann, um diese Aufgabe effizient auszuführen. Wir werden die Schritte, den Code und die Konzepte untersuchen, die zur Lösung dieses Problems erforderlich sind, um sicherzustellen, dass Sie den Prozess verstehen und leicht implementieren können.

Lassen Sie uns zunächst das Problem verstehen, das wir lösen möchten. Stellen Sie sich vor, Sie haben einen Datensatz mit einer Spalte, die Zahlen in Worten enthält, wie „eins“, „zwei“, „drei“ und so weiter. Unser Ziel ist es, diese Wortzahlen mit Python und Pandas in ihre ganzzahligen Gegenstücke umzuwandeln.

Schritt 1: Importieren der erforderlichen Bibliotheken
Um diese Aufgabe zu erfüllen, müssen wir zuerst die erforderlichen Bibliotheken importieren. In diesem Fall verwenden wir die Pandas-Bibliothek zum Handhaben und Manipulieren der Daten und flektieren zum Konvertieren von Wörtern in Zahlen.

import pandas as pd
import inflect

Pandas-Bibliothek

Pandas ist eine Open-Source-Datenmanipulations- und Analysebibliothek, die Datenstrukturen und Funktionen bereitstellt, die für die Handhabung strukturierter Daten erforderlich sind. Es baut auf der Programmiersprache Python auf und spielt eine wichtige Rolle bei der Datenvorverarbeitung, -bereinigung und -analyse. Zu den wichtigsten Datenstrukturen gehören Series, DataFrame und Index, die beim Umgang mit verschiedenen Datentypen und Operationen helfen.

Bibliothek beugen

inflect ist eine Python-Bibliothek, die bei der Berechnung von Plural- und Singularnomen, Ordnungszahlen und der Umwandlung von Zahlen in Wörter oder Wörter in Zahlen hilft. In diesem Artikel konzentrieren wir uns auf die Fähigkeit, Wörter in Zahlen umzuwandeln. Um Inflect zu verwenden, müssen Sie es mit dem folgenden Befehl installieren:

!pip install inflect

Schritt 2: Erstellen eines Pandas-Datenrahmens
Nachdem wir nun die erforderlichen Bibliotheken importiert haben, erstellen wir einen pandas DataFrame mit einer Spalte, die Zahlen als Wörter enthält. Dies dient als Beispieldatensatz zu Illustrationszwecken.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Schritt 3: Wörter in Zahlen umwandeln
Als Nächstes verwenden wir die Inflect-Bibliothek, um die Zahlen in Wörtern in ihre ganzzahligen Gegenstücke umzuwandeln. Wir erstellen eine Funktion namens „convert_word_to_number“, die ein Wort als Eingabe nimmt und die entsprechende Zahl zurückgibt.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

In diesem Codeausschnitt definieren wir eine Funktion, die die Inflect-Engine verwendet, um Wörter in Zahlen umzuwandeln. Anschließend verwenden wir die Methode pandas apply(), um diese Funktion auf jedes Element der Spalte „Numbers_in_words“ im DataFrame anzuwenden.

Zusammenfassend haben wir gesehen, wie Python, Pandas und Inflect verwendet werden können, um Wörter in Zahlen in einem Datensatz umzuwandeln. Pandas dient als wesentliches Werkzeug für die Datenmanipulation, während die Inflect-Bibliothek bei Operationen mit Wörtern und Zahlen hilft. Indem Sie diesen Schritten folgen, können Sie Wortzahlen in Ihren Datensätzen ganz einfach in Ganzzahlen umwandeln und Ihre Daten weiter analysieren und bearbeiten. Viel Spaß beim Codieren!

Zusammenhängende Posts:

Hinterlasse einen Kommentar