Solved: kung paano i-convert ang salita sa numero sa python pandas

Sa mundo ngayon, ang pagmamanipula at pagsusuri ng data ay naging isang mahalagang bahagi ng iba't ibang industriya. Ang isang ganoong gawain na kadalasang nangyayari ay ang pag-convert ng mga salita sa mga numero sa mga dataset. Tatalakayin ng artikulong ito kung paano magagamit ang makapangyarihang library ng Python, ang mga panda, upang maisagawa ang gawaing ito nang mahusay. Susuriin namin ang mga hakbang, code, at mga konseptong kasangkot sa paglutas ng problemang ito, na tinitiyak na naiintindihan mo ang proseso at maipapatupad mo ito nang madali.

Upang magsimula, unawain natin ang problemang nilalayon nating lutasin. Isipin na mayroon kang isang dataset na may column na naglalaman ng mga numerong nakasulat sa mga salita, gaya ng "isa," "dalawa," "tatlo," at iba pa. Ang aming layunin ay i-convert ang mga numero ng salita na ito sa kanilang mga integer na katapat gamit ang Python at panda.

Hakbang 1: Pag-import ng mga kinakailangang aklatan
Upang magawa ang gawaing ito, kailangan muna nating i-import ang mga kinakailangang aklatan. Sa kasong ito, gagamitin namin ang pandas library para sa paghawak at pagmamanipula ng data, at inflect para sa pag-convert ng mga salita sa mga numero.

import pandas as pd
import inflect

aklatan ng mga panda

Ang pandas ay isang open-source na data manipulation at analysis library na nagbibigay ng mga istruktura ng data at mga function na kinakailangan para sa paghawak ng structured na data. Ito ay binuo sa ibabaw ng Python programming language at gumaganap ng mahalagang papel sa preprocessing, paglilinis, at pagsusuri ng data. Ang ilan sa mga pangunahing istruktura ng data nito ay kinabibilangan ng Serye, DataFrame, at Index, na tumutulong sa pagharap sa iba't ibang uri ng data at pagpapatakbo.

inflect library

Ang inflect ay isang Python library na tumutulong sa pag-compute ng maramihan at isahan na mga pangngalan, ordinal, at pag-convert ng mga numero sa mga salita o mga salita sa mga numero. Sa artikulong ito, pagtutuunan natin ng pansin ang kakayahang mag-convert ng mga salita sa mga numero. Upang magamit ang inflect, kakailanganin mong i-install ito gamit ang sumusunod na command:

!pip install inflect

Hakbang 2: Paglikha ng isang pandas DataFrame
Ngayong na-import na natin ang mga kinakailangang aklatan, gumawa tayo ng pandas DataFrame na may column na naglalaman ng mga numero bilang mga salita. Ito ang magsisilbing sample na dataset para sa mga layunin ng paglalarawan.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

Hakbang 3: Pag-convert ng mga salita sa mga numero
Susunod, gagamitin namin ang inflect library upang i-convert ang mga numero sa mga salita sa kanilang mga integer na katapat. Gagawa kami ng function na tinatawag na 'convert_word_to_number' na kumukuha ng isang salita bilang input at ibabalik ang kaukulang numero.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

Sa snippet ng code na ito, tinukoy namin ang isang function na gumagamit ng inflect engine upang i-convert ang mga salita sa mga numero. Pagkatapos ay ginagamit namin ang pandas apply() na paraan upang ilapat ang function na ito sa bawat elemento ng column na 'Numbers_in_words' sa DataFrame.

Sa kabuuan, nakita natin kung paano magagamit ang Python, panda, at inflect para i-convert ang mga salita sa mga numero sa isang dataset. Ang Pandas ay nagsisilbing isang mahalagang tool para sa pagmamanipula ng data, habang ang inflect library ay tumutulong sa mga operasyong kinasasangkutan ng mga salita at numero. Sa pamamagitan ng pagsunod sa mga hakbang na ito, madali mong mako-convert ang mga numero ng salita sa mga integer sa iyong mga dataset at mas masusuri at mamanipula ang iyong data. Maligayang coding!

Kaugnay na mga post:

Mag-iwan ng komento