Rešeno: kako pretvoriti besedo v številko v python pandah

V današnjem svetu sta manipulacija in analiza podatkov postala ključni del različnih industrij. Ena taka naloga, ki se pogosto pojavlja, je pretvorba besed v številke v nizih podatkov. Ta članek bo razpravljal o tem, kako je mogoče Pythonovo zmogljivo knjižnico, pande, uporabiti za učinkovito izvajanje te naloge. Raziskali bomo korake, kodo in koncepte, ki so vključeni v reševanje te težave, in zagotovili, da boste razumeli postopek in ga lahko enostavno implementirali.

Za začetek razumejmo problem, ki ga želimo rešiti. Predstavljajte si, da imate nabor podatkov s stolpcem, ki vsebuje številke, zapisane z besedami, kot so »ena«, »dva«, »tri« itd. Naš cilj je te besedne številke pretvoriti v njihova cela števila s pomočjo Pythona in pand.

1. korak: uvoz potrebnih knjižnic
Za izpolnitev te naloge moramo najprej uvoziti zahtevane knjižnice. V tem primeru bomo uporabljali knjižnico pandas za obdelavo in manipulacijo podatkov ter pregib za pretvorbo besed v številke.

import pandas as pd
import inflect

knjižnica pand

pandas je odprtokodna knjižnica za obdelavo in analizo podatkov, ki zagotavlja podatkovne strukture in funkcije, potrebne za obdelavo strukturiranih podatkov. Zgrajen je na osnovi programskega jezika Python in ima pomembno vlogo pri predprocesiranju, čiščenju in analizi podatkov. Nekatere njegove glavne podatkovne strukture vključujejo serije, DataFrame in indeks, ki pomagajo pri obravnavi različnih tipov podatkov in operacij.

pregib knjižnica

inflect je knjižnica Python, ki pomaga pri računanju množinskih in edninskih samostalnikov, ordinalov in pretvarjanja števil v besede ali besed v števila. V tem članku se bomo osredotočili na njegovo sposobnost pretvorbe besed v številke. Če želite uporabljati inflect, ga boste morali namestiti z naslednjim ukazom:

!pip install inflect

2. korak: Ustvarjanje pandas DataFrame
Zdaj, ko smo uvozili zahtevane knjižnice, ustvarimo pandas DataFrame s stolpcem, ki vsebuje številke kot besede. To bo služilo kot naš vzorčni nabor podatkov za ilustracijo.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

3. korak: Pretvarjanje besed v številke
Nato bomo uporabili knjižnico pregiba za pretvorbo števil v besedah ​​v njihova cela števila. Ustvarili bomo funkcijo, imenovano 'convert_word_to_number', ki sprejme besedo kot vhod in vrne ustrezno številko.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

V tem izrezku kode definiramo funkcijo, ki uporablja pregibni mehanizem za pretvorbo besed v številke. Nato uporabimo metodo pandas apply(), da uporabimo to funkcijo za vsak element stolpca 'Numbers_in_words' v DataFrame.

Če povzamemo, videli smo, kako je mogoče Python, pandas in inflect uporabiti za pretvorbo besed v številke v naboru podatkov. Pandas služi kot bistveno orodje za manipulacijo podatkov, medtem ko knjižnica inflect pomaga pri operacijah, ki vključujejo besede in številke. Če sledite tem korakom, lahko preprosto pretvorite besedne številke v cela števila v svojih naborih podatkov ter dodatno analizirate in manipulirate s svojimi podatki. Veselo kodiranje!

Podobni objav:

Pustite komentar