Ratkaistu: kuinka muuntaa sana numeroiksi python-pandoissa

Nykymaailmassa tietojen käsittelystä ja analysoinnista on tullut keskeinen osa eri toimialoja. Yksi tällainen usein esiintyvä tehtävä on sanojen muuntaminen numeroiksi tietojoukoissa. Tässä artikkelissa keskustellaan siitä, kuinka Pythonin tehokasta kirjastoa, pandaa, voidaan käyttää tämän tehtävän suorittamiseen tehokkaasti. Tutkimme tämän ongelman ratkaisemiseen liittyviä vaiheita, koodia ja käsitteitä varmistaaksemme, että ymmärrät prosessin ja voit toteuttaa sen helposti.

Aluksi meidän on ymmärrettävä ongelma, jonka pyrimme ratkaisemaan. Kuvittele, että sinulla on tietojoukko, jonka sarake sisältää sanoilla kirjoitettuja numeroita, kuten "yksi", "kaksi", "kolme" ja niin edelleen. Tavoitteenamme on muuntaa nämä sanaluvut kokonaislukuisiksi vastineiksi Pythonilla ja pandoilla.

Vaihe 1: Tuo tarvittavat kirjastot
Tämän tehtävän suorittamiseksi meidän on ensin tuotava tarvittavat kirjastot. Tässä tapauksessa käytämme pandakirjastoa tietojen käsittelyyn ja käsittelyyn ja taivutusta sanojen muuntamiseen numeroiksi.

import pandas as pd
import inflect

pandakirjasto

pandas on avoimen lähdekoodin tiedonkäsittely- ja analysointikirjasto, joka tarjoaa strukturoidun tiedon käsittelyyn tarvittavia tietorakenteita ja toimintoja. Se on rakennettu Python-ohjelmointikielen päälle ja sillä on merkittävä rooli tietojen esikäsittelyssä, puhdistuksessa ja analysoinnissa. Joitakin sen tärkeimpiä tietorakenteita ovat Series, DataFrame ja Index, jotka auttavat käsittelemään erilaisia ​​​​tietotyyppejä ja -toimintoja.

taivuta kirjasto

inflec on Python-kirjasto, joka auttaa laskemaan monikko- ja yksikkösubstantiivit, järjestysluvut ja muuntaa numerot sanoiksi tai sanat numeroiksi. Tässä artikkelissa keskitymme sen kykyyn muuntaa sanoja numeroiksi. Jos haluat käyttää inflectiä, sinun on asennettava se seuraavalla komennolla:

!pip install inflect

Vaihe 2: Pandas DataFramen luominen
Nyt kun olemme tuoneet tarvittavat kirjastot, luodaan pandas DataFrame, jossa on sarake, joka sisältää numeroita sanoina. Tämä toimii esimerkkitietoaineistona havainnollistamistarkoituksessa.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Vaihe 3: Sanojen muuntaminen numeroiksi
Seuraavaksi käytämme taivutuskirjastoa muuntaaksemme luvut sanoissa niiden kokonaislukujen vastineiksi. Luomme funktion nimeltä 'convert_word_to_number', joka ottaa sanan syötteenä ja palauttaa vastaavan luvun.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Tässä koodinpätkässä määrittelemme funktion, joka käyttää taivutuskonetta sanojen muuntamiseen numeroiksi. Käytämme sitten pandas apply() -metodia soveltaaksemme tätä funktiota jokaiseen DataFramen Numers_in_words -sarakkeen elementtiin.

Yhteenvetona voidaan todeta, että olemme nähneet, kuinka Python, panda ja taivutus voidaan muuntaa sanoja numeroiksi tietojoukossa. Pandat ovat olennainen työkalu tietojen käsittelyyn, kun taas taivutuskirjasto auttaa sanoja ja numeroita koskevissa toimissa. Seuraamalla näitä vaiheita voit helposti muuntaa sananumerot tietojoukoissasi kokonaisluvuiksi ja analysoida ja käsitellä tietojasi edelleen. Hyvää koodausta!

Related viestiä:

Jätä kommentti