सोडवले: पायथन पांडामध्ये शब्दाचे नंबरमध्ये रूपांतर कसे करावे

आजच्या जगात, डेटा हाताळणी आणि विश्लेषण हा विविध उद्योगांचा एक महत्त्वाचा भाग बनला आहे. असेच एक कार्य जे अनेकदा घडते ते म्हणजे डेटासेटमधील शब्दांचे संख्यांमध्ये रूपांतर करणे. या लेखात पायथनची शक्तिशाली लायब्ररी, पांडा, हे कार्य कार्यक्षमतेने कसे वापरता येईल यावर चर्चा करेल. या समस्येचे निराकरण करण्यात गुंतलेल्या पायऱ्या, कोड आणि संकल्पना आम्ही एक्सप्लोर करू, तुम्ही प्रक्रिया समजून घेऊ शकता आणि ती सहजपणे अंमलात आणू शकता.

सुरुवातीला, आपण ज्या समस्येचे निराकरण करण्याचे उद्दिष्ट ठेवत आहोत ते समजून घेऊ या. अशी कल्पना करा की तुमच्याकडे “एक,” “दोन,” “तीन” आणि यासारख्या शब्दांमध्ये लिहिलेल्या अंकांचा स्तंभ असलेला डेटासेट आहे. पायथन आणि पांडा वापरून या शब्द संख्यांना त्यांच्या पूर्णांक भागांमध्ये रूपांतरित करणे हे आमचे ध्येय आहे.

पायरी 1: आवश्यक लायब्ररी आयात करणे
हे कार्य पूर्ण करण्यासाठी, आपण प्रथम आवश्यक लायब्ररी आयात करणे आवश्यक आहे. या प्रकरणात, आम्ही डेटा हाताळण्यासाठी आणि हाताळण्यासाठी पांडस लायब्ररी वापरणार आहोत आणि शब्दांना संख्यांमध्ये रूपांतरित करण्यासाठी इन्फ्लेक्ट करू.

import pandas as pd
import inflect

पांडा लायब्ररी

pandas एक मुक्त-स्रोत डेटा हाताळणी आणि विश्लेषण लायब्ररी आहे जी संरचित डेटा हाताळण्यासाठी आवश्यक डेटा संरचना आणि कार्ये प्रदान करते. हे पायथन प्रोग्रामिंग भाषेच्या शीर्षस्थानी तयार केले गेले आहे आणि डेटा प्रीप्रोसेसिंग, साफसफाई आणि विश्लेषणामध्ये महत्त्वपूर्ण भूमिका बजावते. त्याच्या काही मुख्य डेटा संरचनांमध्ये मालिका, डेटाफ्रेम आणि इंडेक्स समाविष्ट आहेत, जे विविध डेटा प्रकार आणि ऑपरेशन्स हाताळण्यात मदत करतात.

लायब्ररी वळवा

inflect ही एक पायथन लायब्ररी आहे जी अनेकवचनी आणि एकवचनी संज्ञा, क्रमक्रम आणि संख्यांना शब्दांमध्ये किंवा शब्दांना अंकांमध्ये रूपांतरित करण्यात मदत करते. या लेखात, आम्ही शब्दांना संख्यांमध्ये रूपांतरित करण्याच्या क्षमतेवर लक्ष केंद्रित करू. inflect वापरण्यासाठी, तुम्हाला खालील आदेश वापरून ते स्थापित करावे लागेल:

!pip install inflect

पायरी 2: पांडा डेटाफ्रेम तयार करणे
आता आपण आवश्यक लायब्ररी आयात केल्या आहेत, चला शब्द म्हणून संख्या असलेल्या कॉलमसह एक pandas DataFrame बनवू. हे उदाहरणासाठी आमचा नमुना डेटासेट म्हणून काम करेल.

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

पायरी 3: शब्दांचे संख्यांमध्ये रूपांतर करणे
पुढे, शब्दांमधील संख्यांना त्यांच्या पूर्णांक भागांमध्ये रूपांतरित करण्यासाठी आम्ही इनफ्लेक्ट लायब्ररी वापरू. आम्ही 'convert_word_to_number' नावाचे फंक्शन तयार करू जे एक शब्द इनपुट म्हणून घेते आणि संबंधित संख्या परत करते.

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

या कोड स्निपेटमध्ये, आम्ही एक फंक्शन परिभाषित करतो जे शब्दांना संख्यांमध्ये रूपांतरित करण्यासाठी इन्फ्लेक्ट इंजिनचा वापर करते. त्यानंतर डेटाफ्रेममधील 'Numbers_in_words' कॉलमच्या प्रत्येक घटकावर हे फंक्शन लागू करण्यासाठी आम्ही pandas apply() पद्धत वापरतो.

सारांश, आम्ही Python, pandas आणि inflect चा वापर डेटासेटमधील शब्दांना संख्यांमध्ये रूपांतरित करण्यासाठी कसा केला जाऊ शकतो हे पाहिले आहे. डेटा मॅनिप्युलेशनसाठी पांडा एक आवश्यक साधन म्हणून काम करते, तर इन्फ्लेक्ट लायब्ररी शब्द आणि संख्यांचा समावेश असलेल्या ऑपरेशन्समध्ये मदत करते. या चरणांचे अनुसरण करून, तुम्ही तुमच्या डेटासेटमधील शब्द संख्यांना पूर्णांकांमध्ये सहजपणे रूपांतरित करू शकता आणि तुमच्या डेटाचे विश्लेषण आणि हाताळणी करू शकता. आनंदी कोडिंग!

संबंधित पोस्ट:

एक टिप्पणी द्या