Çözüldü: python pandalarda kelimeyi sayıya dönüştürme

Günümüz dünyasında, veri manipülasyonu ve analizi, çeşitli endüstrilerin çok önemli bir parçası haline geldi. Sıklıkla gerçekleşen böyle bir görev, veri kümelerindeki sözcükleri sayılara dönüştürmektir. Bu makale, Python'un güçlü kütüphanesi olan pandas'ın bu görevi verimli bir şekilde gerçekleştirmek için nasıl kullanılabileceğini tartışacaktır. Süreci kavramanızı ve kolayca uygulayabilmenizi sağlamak için bu sorunu çözmekle ilgili adımları, kodu ve kavramları keşfedeceğiz.

Başlamak için, çözmeyi amaçladığımız sorunu anlayalım. "Bir", "iki", "üç" gibi kelimelerle yazılmış sayıları içeren bir sütuna sahip bir veri kümeniz olduğunu hayal edin. Amacımız, Python ve pandaları kullanarak bu kelime sayılarını tamsayı karşılıklarına dönüştürmektir.

1. Adım: Gerekli kitaplıkları içe aktarma
Bu görevi gerçekleştirmek için önce gerekli kitaplıkları içe aktarmalıyız. Bu durumda, verileri işlemek ve değiştirmek için pandalar kitaplığını ve sözcükleri sayılara dönüştürmek için inflect'i kullanacağız.

import pandas as pd
import inflect

pandalar kitaplığı

pandas, yapılandırılmış verileri işlemek için gereken veri yapılarını ve işlevleri sağlayan açık kaynaklı bir veri işleme ve analiz kitaplığıdır. Python programlama dili üzerine inşa edilmiştir ve veri ön işleme, temizleme ve analiz etmede önemli bir rol oynar. Ana veri yapılarından bazıları, çeşitli veri türleri ve işlemleriyle ilgilenmeye yardımcı olan Series, DataFrame ve Index'i içerir.

kitaplığı bükmek

inflect, çoğul ve tekil isimlerin, sıra sayılarının hesaplanmasına ve sayıların sözcüklere veya sözcüklerin sayılara dönüştürülmesine yardımcı olan bir Python kitaplığıdır. Bu yazıda, kelimeleri sayılara dönüştürme yeteneğine odaklanacağız. Inflect'i kullanmak için aşağıdaki komutu kullanarak yüklemeniz gerekir:

!pip install inflect

2. Adım: Pandas DataFrame oluşturma
Artık gerekli kitaplıkları içe aktardığımıza göre, kelime olarak sayıları içeren bir sütuna sahip bir pandas DataFrame oluşturalım. Bu, örnekleme amacıyla örnek veri setimiz olarak hizmet edecektir.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

3. Adım: Kelimeleri sayılara dönüştürme
Daha sonra, sözcüklerdeki sayıları tamsayı karşılıklarına dönüştürmek için çekim kitaplığını kullanacağız. Bir kelimeyi girdi olarak alan ve karşılık gelen sayıyı döndüren 'convert_word_to_number' adında bir fonksiyon yaratacağız.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Bu kod parçacığında, sözcükleri sayılara dönüştürmek için çekim motorunu kullanan bir işlev tanımlıyoruz. Daha sonra bu işlevi DataFrame'deki 'Numbers_in_words' sütununun her öğesine uygulamak için pandas Apply() yöntemini kullanırız.

Özetlemek gerekirse, bir veri kümesindeki sözcükleri sayılara dönüştürmek için Python, pandalar ve inflect'in nasıl kullanılabileceğini gördük. Pandas, veri manipülasyonu için temel bir araç olarak hizmet ederken, çekim kitaplığı sözcükleri ve sayıları içeren işlemlerde yardımcı olur. Bu adımları izleyerek, veri kümelerinizdeki kelime sayılarını kolayca tam sayılara dönüştürebilir ve verilerinizi daha fazla analiz edip işleyebilirsiniz. Mutlu kodlama!

İlgili Mesajlar:

Leave a Comment