Atrisināts: kā pārvērst vārdu par skaitli python pandās

Mūsdienu pasaulē datu manipulācijas un analīze ir kļuvusi par būtisku dažādu nozaru sastāvdaļu. Viens no šādiem bieži sastopamiem uzdevumiem ir vārdu pārvēršana skaitļos datu kopās. Šajā rakstā tiks apspriests, kā Python jaudīgo bibliotēku pandas var izmantot, lai efektīvi veiktu šo uzdevumu. Mēs izpētīsim šīs problēmas risināšanas darbības, kodu un koncepcijas, nodrošinot, ka jūs saprotat procesu un varat to viegli ieviest.

Sākumā sapratīsim problēmu, kuru mēs vēlamies atrisināt. Iedomājieties, ka jums ir datu kopa ar kolonnu, kurā ir ar vārdiem rakstīti skaitļi, piemēram, “viens”, “divi”, “trīs” un tā tālāk. Mūsu mērķis ir pārvērst šos vārdu skaitļus veselos skaitļos, izmantojot Python un pandas.

1. darbība. Nepieciešamo bibliotēku importēšana
Lai veiktu šo uzdevumu, mums vispirms ir jāimportē vajadzīgās bibliotēkas. Šajā gadījumā mēs izmantosim pandas bibliotēku, lai apstrādātu un manipulētu ar datiem, un locījumu, lai vārdus pārvērstu skaitļos.

import pandas as pd
import inflect

pandas bibliotēka

pandas ir atvērtā pirmkoda datu manipulācijas un analīzes bibliotēka, kas nodrošina datu struktūras un funkcijas, kas nepieciešamas strukturētu datu apstrādei. Tā ir balstīta uz Python programmēšanas valodu, un tai ir nozīmīga loma datu priekšapstrādē, tīrīšanā un analīzē. Dažas no galvenajām datu struktūrām ietver Series, DataFrame un Index, kas palīdz tikt galā ar dažādiem datu tipiem un darbībām.

locīšanas bibliotēka

inflect ir Python bibliotēka, kas palīdz aprēķināt daudzskaitļa un vienskaitļa lietvārdus, kārtas vārdus un pārvērst skaitļus vārdos vai vārdus skaitļos. Šajā rakstā mēs koncentrēsimies uz tā spēju pārvērst vārdus skaitļos. Lai izmantotu inflec, jums tas būs jāinstalē, izmantojot šādu komandu:

!pip install inflect

2. darbība. Pandas DataFrame izveide
Tagad, kad esam importējuši vajadzīgās bibliotēkas, izveidosim pandas DataFrame ar kolonnu, kas satur skaitļus kā vārdus. Tas kalpos kā mūsu datu kopas paraugs ilustrācijas nolūkos.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

3. darbība: vārdu pārvēršana skaitļos
Tālāk mēs izmantosim locījuma bibliotēku, lai pārvērstu skaitļus vārdos to veselos skaitļos. Mēs izveidosim funkciju “convert_word_to_number”, kas izmanto vārdu kā ievadi un atgriež atbilstošo skaitli.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Šajā koda fragmentā mēs definējam funkciju, kas izmanto locīšanas dzinēju, lai pārvērstu vārdus skaitļos. Pēc tam mēs izmantojam metodi pandas apply(), lai lietotu šo funkciju katram DataFrame kolonnas "Numbs_in_words" elementam.

Rezumējot, mēs esam redzējuši, kā Python, pandas un inflect var izmantot, lai datu kopā pārvērstu vārdus par skaitļiem. Pandas kalpo kā būtisks datu manipulācijas rīks, savukārt locījuma bibliotēka palīdz darbībām, kas saistītas ar vārdiem un cipariem. Veicot šīs darbības, varat viegli konvertēt vārdu skaitļus par veseliem skaitļiem savās datu kopās un turpināt analizēt un manipulēt ar datiem. Laimīgu kodēšanu!

Related posts:

Leave a Comment