Vyriešené: ako previesť slovo na číslo v python pandách

V dnešnom svete sa manipulácia a analýza údajov stali kľúčovou súčasťou rôznych priemyselných odvetví. Jednou z takýchto úloh, ktorá sa často vyskytuje, je prevod slov na čísla v súboroch údajov. Tento článok bude diskutovať o tom, ako sa dá použiť výkonná knižnica Pythonu, pandy, na efektívne vykonávanie tejto úlohy. Preskúmame kroky, kód a koncepty, ktoré sú súčasťou riešenia tohto problému, pričom zabezpečíme, aby ste pochopili proces a mohli ho ľahko implementovať.

Na začiatok pochopme problém, ktorý sa snažíme vyriešiť. Predstavte si, že máte množinu údajov so stĺpcom obsahujúcim čísla napísané slovami, ako napríklad „jeden“, „dva“, „tri“ atď. Naším cieľom je previesť tieto čísla slov na ich celočíselné náprotivky pomocou jazyka Python a pandy.

Krok 1: Importovanie potrebných knižníc
Aby sme splnili túto úlohu, musíme najprv importovať požadované knižnice. V tomto prípade budeme používať knižnicu pandas na manipuláciu a manipuláciu s údajmi a skloňovanie na konverziu slov na čísla.

import pandas as pd
import inflect

knižnica pandy

pandas je open source knižnica na manipuláciu a analýzu údajov, ktorá poskytuje dátové štruktúry a funkcie potrebné na spracovanie štruktúrovaných dát. Je postavený na vrchole programovacieho jazyka Python a hrá významnú úlohu pri predspracovaní, čistení a analýze údajov. Niektoré z jeho hlavných dátových štruktúr zahŕňajú Series, DataFrame a Index, ktoré pomáhajú pri práci s rôznymi typmi údajov a operáciami.

skloňovať knižnicu

inflect je knižnica Pythonu, ktorá pomáha pri výpočte podstatných mien v množnom čísle a jednotnom čísle, ordinálnych čísel a pri prevode čísel na slová alebo slov na čísla. V tomto článku sa zameriame na jeho schopnosť konvertovať slová na čísla. Ak chcete použiť inflex, budete ho musieť nainštalovať pomocou nasledujúceho príkazu:

!pip install inflect

Krok 2: Vytvorenie dátového rámca pandas
Teraz, keď sme importovali požadované knižnice, vytvorme pandas DataFrame so stĺpcom obsahujúcim čísla ako slová. Toto bude slúžiť ako vzorový súbor údajov na účely ilustrácie.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Krok 3: Prevod slov na čísla
Ďalej použijeme inflexnú knižnicu na prevod čísel v slovách na ich celočíselné náprotivky. Vytvoríme funkciu s názvom 'convert_word_to_number', ktorá vezme slovo ako vstup a vráti zodpovedajúce číslo.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

V tomto úryvku kódu definujeme funkciu, ktorá využíva inflexný mechanizmus na konverziu slov na čísla. Potom použijeme metódu pandas apply() na aplikáciu tejto funkcie na každý prvok stĺpca 'Numbers_in_words' v DataFrame.

Aby som to zhrnul, videli sme, ako možno použiť Python, pandy a skloňovanie na konverziu slov na čísla v množine údajov. Pandy slúžia ako základný nástroj na manipuláciu s údajmi, zatiaľ čo knižnica ohýbania pomáha pri operáciách so slovami a číslami. Podľa týchto krokov môžete jednoducho previesť čísla slov na celé čísla v súboroch údajov a ďalej analyzovať a manipulovať s údajmi. Šťastné kódovanie!

Súvisiace príspevky:

Pridať komentár