Megoldva: hogyan lehet szót számmá alakítani python pandákban

A mai világban az adatok manipulálása és elemzése a különböző iparágak kulcsfontosságú részévé vált. Az egyik ilyen gyakran előforduló feladat a szavak számokká alakítása az adatkészletekben. Ez a cikk megvitatja, hogy a Python hatékony könyvtára, a panda hogyan használható a feladat hatékony végrehajtására. Megvizsgáljuk a probléma megoldásához szükséges lépéseket, kódot és koncepciókat, biztosítva, hogy megértse a folyamatot és könnyen megvalósíthassa.

Először is értsük meg azt a problémát, amelyet meg akarunk oldani. Képzelje el, hogy van egy adatkészlete, amelynek oszlopa szavakkal írt számokat tartalmaz, például „egy”, „kettő”, „három” és így tovább. Célunk, hogy ezeket a szószámokat egész számokká alakítsuk át Python és panda használatával.

1. lépés: A szükséges könyvtárak importálása
A feladat végrehajtásához először importálni kell a szükséges könyvtárakat. Ebben az esetben a pandas könyvtárat fogjuk használni az adatok kezelésére és manipulálására, a ragozást pedig a szavak számokká alakítására.

import pandas as pd
import inflect

panda könyvtár

A pandas egy nyílt forráskódú adatkezelési és -elemző könyvtár, amely a strukturált adatok kezeléséhez szükséges adatstruktúrákat és funkciókat biztosítja. A Python programozási nyelvre épül, és jelentős szerepet játszik az adatok előfeldolgozásában, tisztításában és elemzésében. Főbb adatstruktúrái közé tartozik a Series, a DataFrame és az Index, amelyek segítenek a különféle adattípusok és műveletek kezelésében.

inflexiós könyvtár

Az inflec egy Python-könyvtár, amely segít a többes és egyes számú főnevek, sorszámok kiszámításában, valamint a számok szavakká, illetve a szavak számokká alakításában. Ebben a cikkben a szavak számokká alakítására való képességére összpontosítunk. Az inflex használatához telepítenie kell a következő paranccsal:

!pip install inflect

2. lépés: Pandas DataFrame létrehozása
Most, hogy importáltuk a szükséges könyvtárakat, hozzunk létre egy pandas DataFrame-et, amelynek oszlopa számokat tartalmaz szavakként. Ez szolgál majd mintaadatkészletünknek szemléltetés céljából.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

3. lépés: Szavak átalakítása számokká
Ezután az inflexiós könyvtár segítségével konvertáljuk a szavakban szereplő számokat egész megfelelőikre. Létrehozunk egy 'szó_számmá konvertálása' nevű függvényt, amely bemenetként egy szót vesz fel, és a megfelelő számot adja vissza.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Ebben a kódrészletben egy olyan függvényt határozunk meg, amely a ragozási motort használja a szavak számokká alakítására. Ezután a pandas apply() metódussal alkalmazzuk ezt a függvényt a DataFrame „Számok_szavakban” oszlopának minden elemére.

Összefoglalva, láttuk, hogyan lehet a Python, a panda és a ragozás segítségével szavakat számokká alakítani egy adatkészletben. A pandák alapvető eszközként szolgálnak az adatkezeléshez, míg az inflexiós könyvtár a szavakkal és számokkal végzett műveletekben segít. Ha követi ezeket a lépéseket, egyszerűen konvertálhatja a szószámokat egész számokká az adatkészleteiben, és tovább elemezheti és manipulálhatja az adatokat. Boldog kódolást!

Kapcsolódó hozzászólások:

Írj hozzászólást