Rezolvat: cum se transformă un cuvânt în număr în Python Pandas

În lumea de astăzi, manipularea și analiza datelor au devenit o parte crucială a diferitelor industrii. O astfel de sarcină care apare adesea este conversia cuvintelor în numere în seturile de date. Acest articol va discuta despre modul în care biblioteca puternică a lui Python, panda, poate fi utilizată pentru a îndeplini această sarcină în mod eficient. Vom explora pașii, codul și conceptele implicate în rezolvarea acestei probleme, asigurându-ne că înțelegeți procesul și îl puteți implementa cu ușurință.

Pentru început, să înțelegem problema pe care ne propunem să o rezolvăm. Imaginați-vă că aveți un set de date cu o coloană care conține numere scrise în cuvinte, cum ar fi „unu”, „doi”, „trei” și așa mai departe. Scopul nostru este de a converti aceste numere de cuvinte în omologii lor întregi folosind Python și panda.

Pasul 1: Importul bibliotecilor necesare
Pentru a îndeplini această sarcină, trebuie mai întâi să importam bibliotecile necesare. În acest caz, vom folosi biblioteca panda pentru manipularea și manipularea datelor și vom folosi inflexia pentru a converti cuvintele în numere.

import pandas as pd
import inflect

biblioteca panda

pandas este o bibliotecă open-source de manipulare și analiză a datelor care oferă structuri de date și funcții necesare pentru manipularea datelor structurate. Este construit pe baza limbajului de programare Python și joacă un rol important în preprocesarea, curățarea și analizarea datelor. Unele dintre principalele sale structuri de date includ Series, DataFrame și Index, care ajută la tratarea diferitelor tipuri de date și operațiuni.

bibliotecă flex

inflect este o bibliotecă Python care ajută la calcularea substantivelor plurale și singulare, ordinale și conversia numerelor în cuvinte sau cuvintelor în numere. În acest articol, ne vom concentra asupra capacității sale de a converti cuvintele în numere. Pentru a utiliza inflect, va trebui să îl instalați folosind următoarea comandă:

!pip install inflect

Pasul 2: Crearea unui DataFrame panda
Acum că am importat bibliotecile necesare, să creăm un Pandas DataFrame cu o coloană care conține numere ca cuvinte. Acesta va servi ca set de date eșantion în scopuri ilustrative.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Pasul 3: Transformarea cuvintelor în numere
În continuare, vom folosi biblioteca flex pentru a converti numerele în cuvinte în omologii lor întregi. Vom crea o funcție numită „convert_word_to_number” care ia un cuvânt ca intrare și returnează numărul corespunzător.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

În acest fragment de cod, definim o funcție care utilizează motorul de inflexiune pentru a converti cuvintele în numere. Apoi folosim metoda panda apply() pentru a aplica această funcție fiecărui element al coloanei „Numbers_in_words” din DataFrame.

Pentru a rezuma, am văzut cum Python, panda și inflect pot fi folosite pentru a converti cuvinte în numere dintr-un set de date. Pandas servește ca un instrument esențial pentru manipularea datelor, în timp ce biblioteca de inflexiuni ajută la operațiuni care implică cuvinte și numere. Urmând acești pași, puteți converti cu ușurință numerele de cuvinte în numere întregi din seturile dvs. de date și puteți analiza și manipula în continuare datele. Codare fericită!

Postări asemănatoare:

Lăsați un comentariu