Résolu : comment convertir un mot en nombre dans les pandas python

Dans le monde d'aujourd'hui, la manipulation et l'analyse des données sont devenues un élément crucial de diverses industries. L'une de ces tâches qui se produit souvent consiste à convertir des mots en nombres dans des ensembles de données. Cet article explique comment la puissante bibliothèque de Python, pandas, peut être utilisée pour effectuer cette tâche efficacement. Nous explorerons les étapes, le code et les concepts impliqués dans la résolution de ce problème, en veillant à ce que vous compreniez le processus et que vous puissiez le mettre en œuvre facilement.

Pour commencer, comprenons le problème que nous cherchons à résoudre. Imaginez que vous ayez un ensemble de données avec une colonne contenant des nombres écrits avec des mots, tels que « un », « deux », « trois », etc. Notre objectif est de convertir ces nombres de mots en leurs homologues entiers en utilisant Python et pandas.

Étape 1 : Importation des bibliothèques nécessaires
Pour accomplir cette tâche, nous devons d'abord importer les bibliothèques requises. Dans ce cas, nous utiliserons la bibliothèque pandas pour gérer et manipuler les données, et infléchir pour convertir les mots en nombres.

import pandas as pd
import inflect

bibliothèque de pandas

pandas est une bibliothèque open source de manipulation et d'analyse de données qui fournit les structures de données et les fonctions nécessaires au traitement des données structurées. Il est construit sur le langage de programmation Python et joue un rôle important dans le prétraitement, le nettoyage et l'analyse des données. Certaines de ses principales structures de données incluent Series, DataFrame et Index, qui aident à traiter divers types de données et opérations.

bibliothèque d'inflexion

inflect est une bibliothèque Python qui aide à calculer les pluriels et les noms singuliers, les ordinaux et à convertir les nombres en mots ou les mots en nombres. Dans cet article, nous nous concentrerons sur sa capacité à convertir des mots en nombres. Pour utiliser inflect, vous devrez l'installer à l'aide de la commande suivante :

!pip install inflect

Étape 2 : Création d'un DataFrame pandas
Maintenant que nous avons importé les bibliothèques requises, créons un DataFrame pandas avec une colonne contenant des nombres sous forme de mots. Cela servira d'exemple d'ensemble de données à des fins d'illustration.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Étape 3 : Convertir des mots en nombres
Ensuite, nous utiliserons la bibliothèque inflect pour convertir les nombres en mots en leurs homologues entiers. Nous allons créer une fonction appelée 'convert_word_to_number' qui prend un mot en entrée et renvoie le nombre correspondant.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Dans cet extrait de code, nous définissons une fonction qui utilise le moteur d'inflexion pour convertir des mots en nombres. Nous utilisons ensuite la méthode pandas apply() pour appliquer cette fonction à chaque élément de la colonne 'Numbers_in_words' dans le DataFrame.

Pour résumer, nous avons vu comment Python, pandas et inflect peuvent être utilisés pour convertir des mots en nombres dans un ensemble de données. Pandas est un outil essentiel pour la manipulation de données, tandis que la bibliothèque inflect aide dans les opérations impliquant des mots et des nombres. En suivant ces étapes, vous pouvez facilement convertir des nombres de mots en nombres entiers dans vos ensembles de données et analyser et manipuler davantage vos données. Bon codage !

Articles connexes

Laisser un commentaire