Resolvido: como converter palavra em número em pandas python

No mundo de hoje, a manipulação e análise de dados tornaram-se uma parte crucial de vários setores. Uma dessas tarefas que ocorre com frequência é a conversão de palavras em números em conjuntos de dados. Este artigo discutirá como a poderosa biblioteca do Python, pandas, pode ser usada para executar essa tarefa com eficiência. Exploraremos as etapas, o código e os conceitos envolvidos na solução desse problema, garantindo que você entenda o processo e possa implementá-lo facilmente.

Para começar, vamos entender o problema que pretendemos resolver. Imagine que você tenha um conjunto de dados com uma coluna contendo números escritos em palavras, como “um”, “dois”, “três” e assim por diante. Nosso objetivo é converter esses números de palavras em suas contrapartes inteiras usando Python e pandas.

Passo 1: Importando as bibliotecas necessárias
Para realizar esta tarefa, devemos primeiro importar as bibliotecas necessárias. Nesse caso, usaremos a biblioteca pandas para manipular e manipular os dados e flexionar para converter palavras em números.

import pandas as pd
import inflect

biblioteca pandas

pandas é uma biblioteca de manipulação e análise de dados de código aberto que fornece estruturas de dados e funções necessárias para lidar com dados estruturados. Ele é construído sobre a linguagem de programação Python e desempenha um papel significativo no pré-processamento, limpeza e análise de dados. Algumas de suas principais estruturas de dados incluem Series, DataFrame e Index, que ajudam a lidar com vários tipos de dados e operações.

biblioteca de flexões

flexion é uma biblioteca Python que auxilia no cálculo de substantivos plurais e singulares, ordinais e na conversão de números em palavras ou palavras em números. Neste artigo, vamos nos concentrar em sua capacidade de converter palavras em números. Para usar o inflect, você precisará instalá-lo usando o seguinte comando:

!pip install inflect

Passo 2: Criando um DataFrame pandas
Agora que importamos as bibliotecas necessárias, vamos criar um DataFrame pandas com uma coluna contendo números como palavras. Isso servirá como nosso conjunto de dados de amostra para fins de ilustração.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Passo 3: Convertendo palavras em números
Em seguida, usaremos a biblioteca flexionar para converter os números em palavras para suas contrapartes inteiras. Vamos criar uma função chamada 'convert_word_to_number' que recebe uma palavra como entrada e retorna o número correspondente.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Neste trecho de código, definimos uma função que utiliza o mecanismo de flexão para converter palavras em números. Em seguida, usamos o método pandas apply() para aplicar essa função a cada elemento da coluna 'Numbers_in_words' no DataFrame.

Resumindo, vimos como Python, pandas e inflect podem ser usados ​​para converter palavras em números em um conjunto de dados. Pandas serve como uma ferramenta essencial para manipulação de dados, enquanto a biblioteca inflect auxilia em operações envolvendo palavras e números. Seguindo essas etapas, você pode facilmente converter números de palavras em números inteiros em seus conjuntos de dados e analisar e manipular seus dados. Codificação feliz!

Artigos relacionados:

Deixe um comentário