Lahendatud: kuidas python pandas sõna numbriks teisendada

Tänapäeva maailmas on andmetega manipuleerimine ja analüüs muutunud erinevate tööstusharude oluliseks osaks. Üks selline sageli esinev ülesanne on sõnade teisendamine numbriteks andmekogumites. Selles artiklis arutatakse, kuidas Pythoni võimsat teeki pandasid saab selle ülesande tõhusaks täitmiseks kasutada. Uurime selle probleemi lahendamisega seotud samme, koodi ja kontseptsioone, tagades, et mõistate protsessi ja saate seda hõlpsalt rakendada.

Alustuseks mõistame probleemi, mille lahendamise eesmärk on. Kujutage ette, et teil on andmestik, mille veerg sisaldab sõnadega kirjutatud numbreid, näiteks "üks", "kaks", "kolm" jne. Meie eesmärk on muuta need sõnaarvud Pythoni ja pandade abil täisarvudeks.

1. samm: vajalike teekide importimine
Selle ülesande täitmiseks peame esmalt importima vajalikud teegid. Sel juhul kasutame andmete käsitlemiseks ja manipuleerimiseks pandateeki ning sõnade arvudeks teisendamiseks käänet.

import pandas as pd
import inflect

pandade raamatukogu

pandas on avatud lähtekoodiga andmetega manipuleerimise ja analüüsi teek, mis pakub struktureeritud andmete käsitlemiseks vajalikke andmestruktuure ja funktsioone. See on üles ehitatud Pythoni programmeerimiskeelele ja mängib olulist rolli andmete eeltöötlemisel, puhastamisel ja analüüsimisel. Mõned selle peamised andmestruktuurid hõlmavad Series, DataFrame ja Index, mis aitavad käsitleda erinevaid andmetüüpe ja toiminguid.

käänata raamatukogu

inflect on Pythoni teek, mis aitab arvutada mitmuse ja ainsuse nimisõnu, järgarvusid ning teisendada numbreid sõnadeks või sõnu arvudeks. Selles artiklis keskendume selle võimele sõnu numbriteks teisendada. Inflekti kasutamiseks peate selle installima järgmise käsu abil:

!pip install inflect

2. samm: panda DataFrame'i loomine
Nüüd, kui oleme vajalikud teegid importinud, loome panda DataFrame'i, mille veerg sisaldab sõnadena numbreid. See on näidisandmekogum illustreerimiseks.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

3. samm: sõnade teisendamine numbriteks
Järgmisena kasutame käändeteeki, et teisendada numbrid sõnades nende täisarvudeks. Loome funktsiooni nimega 'convert_word_to_number', mis võtab sisendiks sõna ja tagastab vastava numbri.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Selles koodilõigul määratleme funktsiooni, mis kasutab sõnade arvudeks teisendamiseks käändemootorit. Seejärel kasutame meetodit pandas apply(), et rakendada see funktsioon DataFrame'i veeru „Numbers_in_words” igale elemendile.

Kokkuvõtteks oleme näinud, kuidas Pythonit, pandasid ja käänet saab kasutada andmestiku sõnade arvudeks teisendamiseks. Pandad on oluline tööriist andmetega manipuleerimiseks, samas kui käändeteek aitab sõnu ja numbreid hõlmavates toimingutes. Järgides neid samme, saate hõlpsasti teisendada sõnade numbreid oma andmekogumites täisarvudeks ning oma andmeid edasi analüüsida ja nendega manipuleerida. Head kodeerimist!

Seonduvad postitused:

Jäta kommentaar