Решено: как да конвертирате дума в число в python pandas

В днешния свят манипулирането и анализът на данни са се превърнали в решаваща част от различни индустрии. Една такава задача, която често възниква, е преобразуването на думи в числа в набори от данни. Тази статия ще обсъди как мощната библиотека на Python, pandas, може да се използва за ефективно изпълнение на тази задача. Ние ще проучим стъпките, кода и концепциите, включени в решаването на този проблем, като гарантираме, че разбирате процеса и можете да го приложите лесно.

Като начало нека разберем проблема, който се стремим да разрешим. Представете си, че имате набор от данни с колона, съдържаща числа, написани с думи, като „едно“, „две“, „три“ и т.н. Нашата цел е да преобразуваме тези числа на думи в техните цели числа с помощта на Python и pandas.

Стъпка 1: Импортиране на необходимите библиотеки
За да изпълним тази задача, първо трябва да импортираме необходимите библиотеки. В този случай ние ще използваме библиотеката pandas за обработка и манипулиране на данните и флексия за преобразуване на думи в числа.

import pandas as pd
import inflect

библиотека с панди

pandas е библиотека с отворен код за манипулиране и анализ на данни, която предоставя структури от данни и функции, необходими за обработка на структурирани данни. Той е изграден върху езика за програмиране Python и играе важна роля в предварителната обработка, почистването и анализирането на данни. Някои от неговите основни структури от данни включват Series, DataFrame и Index, които помагат при работа с различни типове данни и операции.

инфлект библиотека

inflect е библиотека на Python, която помага при изчисляване на съществителни имена в множествено и единствено число, редни числа и преобразуване на числа в думи или думи в числа. В тази статия ще се съсредоточим върху способността му да преобразува думи в числа. За да използвате inflect, ще трябва да го инсталирате чрез следната команда:

!pip install inflect

Стъпка 2: Създаване на pandas DataFrame
Сега, след като импортирахме необходимите библиотеки, нека създадем pandas DataFrame с колона, съдържаща числа като думи. Това ще служи като примерен набор от данни за илюстративни цели.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Стъпка 3: Преобразуване на думи в числа
След това ще използваме библиотеката inflect, за да преобразуваме числата в думи в техните цели числа. Ще създадем функция, наречена 'convert_word_to_number', която приема дума като вход и връща съответното число.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

В този кодов фрагмент ние дефинираме функция, която използва инфлект машината за преобразуване на думи в числа. След това използваме метода pandas apply(), за да приложим тази функция към всеки елемент от колоната „Numbers_in_words“ в DataFrame.

За да обобщим, видяхме как Python, pandas и inflect могат да се използват за преобразуване на думи в числа в набор от данни. Pandas служи като основен инструмент за манипулиране на данни, докато библиотеката inflect помага при операции, включващи думи и числа. Като следвате тези стъпки, можете лесно да конвертирате числата на думите в цели числа във вашите набори от данни и допълнително да анализирате и манипулирате вашите данни. Приятно кодиране!

Подобни публикации:

Оставете коментар