Riješeno: kako pretvoriti riječ u broj u python pandama

U današnjem svijetu manipulacija i analiza podataka postali su ključni dio raznih industrija. Jedan takav zadatak koji se često pojavljuje je pretvaranje riječi u brojeve u skupovima podataka. Ovaj članak govori o tome kako se Pythonova moćna biblioteka, pandas, može koristiti za učinkovito obavljanje ovog zadatka. Istražit ćemo korake, kôd i koncepte uključene u rješavanje ovog problema, osiguravajući da shvatite proces i da ga možete jednostavno implementirati.

Za početak, shvatimo problem koji želimo riješiti. Zamislite da imate skup podataka sa stupcem koji sadrži brojeve napisane riječima, kao što su "jedan", "dva", "tri" i tako dalje. Naš je cilj pretvoriti ove brojeve riječi u njihove cijele brojeve koristeći Python i pandas.

Korak 1: Uvoz potrebnih biblioteka
Da bismo izvršili ovaj zadatak, prvo moramo uvesti potrebne biblioteke. U ovom slučaju koristit ćemo biblioteku pandas za rukovanje i manipuliranje podacima, a inflect za pretvaranje riječi u brojeve.

import pandas as pd
import inflect

knjižnica pandi

pandas je knjižnica otvorenog koda za manipulaciju i analizu podataka koja pruža podatkovne strukture i funkcije potrebne za rukovanje strukturiranim podacima. Izgrađen je na temelju programskog jezika Python i igra značajnu ulogu u pretprocesiranju, čišćenju i analizi podataka. Neke od njegovih glavnih podatkovnih struktura uključuju Series, DataFrame i Index, koje pomažu u radu s različitim vrstama podataka i operacijama.

inflect knjižnica

inflect je Python biblioteka koja pomaže u računanju množine i jednine imenica, rednih brojeva i pretvaranju brojeva u riječi ili riječi u brojeve. U ovom ćemo se članku usredotočiti na njegovu sposobnost pretvaranja riječi u brojeve. Da biste koristili inflect, morat ćete ga instalirati pomoću sljedeće naredbe:

!pip install inflect

Korak 2: Stvaranje pandas DataFramea
Sada kada smo uvezli potrebne biblioteke, stvorimo pandas DataFrame sa stupcem koji sadrži brojeve kao riječi. Ovo će poslužiti kao naš uzorak skupa podataka u svrhu ilustracije.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Korak 3: Pretvaranje riječi u brojeve
Zatim ćemo upotrijebiti biblioteku inflect za pretvaranje brojeva u riječima u njihove cjelobrojne ekvivalente. Napravit ćemo funkciju pod nazivom 'convert_word_to_number' koja uzima riječ kao ulaz i vraća odgovarajući broj.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

U ovom isječku koda definiramo funkciju koja koristi inflect mehanizam za pretvaranje riječi u brojeve. Zatim koristimo metodu pandas apply() da primijenimo ovu funkciju na svaki element stupca 'Numbers_in_words' u DataFrameu.

Ukratko, vidjeli smo kako se Python, pandas i inflect mogu koristiti za pretvaranje riječi u brojeve u skupu podataka. Pandas služi kao osnovni alat za manipulaciju podacima, dok knjižnica inflect pomaže u operacijama koje uključuju riječi i brojeve. Slijedeći ove korake, možete jednostavno pretvoriti brojeve riječi u cijele brojeve u svojim skupovima podataka te dalje analizirati i manipulirati svojim podacima. Sretno kodiranje!

Povezani postovi:

Ostavite komentar