V dnešním světě se manipulace a analýza dat staly klíčovou součástí různých průmyslových odvětví. Jedním z takových úkolů, který se často vyskytuje, je převod slov na čísla v datových sadách. Tento článek pojednává o tom, jak lze k efektivnímu provedení tohoto úkolu použít výkonnou knihovnu Pythonu, pandy. Prozkoumáme kroky, kód a koncepty spojené s řešením tohoto problému, abychom zajistili, že proces pochopíte a budete jej moci snadno implementovat.
Nejprve pochopme problém, který chceme vyřešit. Představte si, že máte datovou sadu se sloupcem obsahujícím čísla napsaná slovy, jako je „jeden“, „dva“, „tři“ a tak dále. Naším cílem je převést tato čísla slov na jejich celočíselné protějšky pomocí Pythonu a pand.
Krok 1: Import potřebných knihoven
Abychom tento úkol splnili, musíme nejprve importovat požadované knihovny. V tomto případě budeme používat knihovnu pandas pro manipulaci a manipulaci s daty a skloňování pro převod slov na čísla.
import pandas as pd import inflect
knihovna pand
pandas je open source knihovna pro manipulaci a analýzu dat, která poskytuje datové struktury a funkce potřebné pro manipulaci se strukturovanými daty. Je postaven na vrcholu programovacího jazyka Python a hraje významnou roli při předběžném zpracování, čištění a analýze dat. Některé z jeho hlavních datových struktur zahrnují Series, DataFrame a Index, které pomáhají při práci s různými datovými typy a operacemi.
skloňovat knihovnu
inflect je knihovna Pythonu, která pomáhá při počítání podstatných jmen v množném čísle a jednotného čísla, řadových čísel a převodu čísel na slova nebo slov na čísla. V tomto článku se zaměříme na jeho schopnost převádět slova na čísla. Chcete-li použít inflect, budete jej muset nainstalovat pomocí následujícího příkazu:
!pip install inflect
Krok 2: Vytvoření pandas DataFrame
Nyní, když jsme importovali požadované knihovny, vytvořte pandas DataFrame se sloupcem obsahujícím čísla jako slova. To bude sloužit jako naše ukázková datová sada pro ilustrační účely.
data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']} df = pd.DataFrame(data) print(df)
Krok 3: Převod slov na čísla
Dále použijeme inflexní knihovnu k převodu čísel ve slovech na jejich celočíselné protějšky. Vytvoříme funkci nazvanou 'convert_word_to_number', která vezme slovo jako vstup a vrátí odpovídající číslo.
def convert_word_to_number(word): p = inflect.engine() try: return p.singular_noun(word) except: return None df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number) print(df)
V tomto úryvku kódu definujeme funkci, která využívá inflexní stroj k převodu slov na čísla. Poté použijeme metodu pandas apply() k aplikaci této funkce na každý prvek sloupce 'Numbers_in_words' v DataFrame.
Abychom to shrnuli, viděli jsme, jak lze Python, pandy a inflexe použít k převodu slov na čísla v datové sadě. Pandas slouží jako základní nástroj pro manipulaci s daty, zatímco knihovna ohýbání pomáhá při operacích zahrnujících slova a čísla. Pomocí těchto kroků můžete snadno převést čísla slov na celá čísla ve svých datových sadách a dále analyzovat a manipulovat s daty. Šťastné kódování!