Vyřešeno: jak převést slovo na číslo v python pandas

V dnešním světě se manipulace a analýza dat staly klíčovou součástí různých průmyslových odvětví. Jedním z takových úkolů, který se často vyskytuje, je převod slov na čísla v datových sadách. Tento článek pojednává o tom, jak lze k efektivnímu provedení tohoto úkolu použít výkonnou knihovnu Pythonu, pandy. Prozkoumáme kroky, kód a koncepty spojené s řešením tohoto problému, abychom zajistili, že proces pochopíte a budete jej moci snadno implementovat.

Nejprve pochopme problém, který chceme vyřešit. Představte si, že máte datovou sadu se sloupcem obsahujícím čísla napsaná slovy, jako je „jeden“, „dva“, „tři“ a tak dále. Naším cílem je převést tato čísla slov na jejich celočíselné protějšky pomocí Pythonu a pand.

Krok 1: Import potřebných knihoven
Abychom tento úkol splnili, musíme nejprve importovat požadované knihovny. V tomto případě budeme používat knihovnu pandas pro manipulaci a manipulaci s daty a skloňování pro převod slov na čísla.

import pandas as pd
import inflect

knihovna pand

pandas je open source knihovna pro manipulaci a analýzu dat, která poskytuje datové struktury a funkce potřebné pro manipulaci se strukturovanými daty. Je postaven na vrcholu programovacího jazyka Python a hraje významnou roli při předběžném zpracování, čištění a analýze dat. Některé z jeho hlavních datových struktur zahrnují Series, DataFrame a Index, které pomáhají při práci s různými datovými typy a operacemi.

skloňovat knihovnu

inflect je knihovna Pythonu, která pomáhá při počítání podstatných jmen v množném čísle a jednotného čísla, řadových čísel a převodu čísel na slova nebo slov na čísla. V tomto článku se zaměříme na jeho schopnost převádět slova na čísla. Chcete-li použít inflect, budete jej muset nainstalovat pomocí následujícího příkazu:

!pip install inflect

Krok 2: Vytvoření pandas DataFrame
Nyní, když jsme importovali požadované knihovny, vytvořte pandas DataFrame se sloupcem obsahujícím čísla jako slova. To bude sloužit jako naše ukázková datová sada pro ilustrační účely.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Krok 3: Převod slov na čísla
Dále použijeme inflexní knihovnu k převodu čísel ve slovech na jejich celočíselné protějšky. Vytvoříme funkci nazvanou 'convert_word_to_number', která vezme slovo jako vstup a vrátí odpovídající číslo.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

V tomto úryvku kódu definujeme funkci, která využívá inflexní stroj k převodu slov na čísla. Poté použijeme metodu pandas apply() k aplikaci této funkce na každý prvek sloupce 'Numbers_in_words' v DataFrame.

Abychom to shrnuli, viděli jsme, jak lze Python, pandy a inflexe použít k převodu slov na čísla v datové sadě. Pandas slouží jako základní nástroj pro manipulaci s daty, zatímco knihovna ohýbání pomáhá při operacích zahrnujících slova a čísla. Pomocí těchto kroků můžete snadno převést čísla slov na celá čísla ve svých datových sadách a dále analyzovat a manipulovat s daty. Šťastné kódování!

Související příspěvky:

Zanechat komentář