हल: अजगर पांडा में शब्द को संख्या में कैसे बदलें

आज की दुनिया में, डेटा हेरफेर और विश्लेषण विभिन्न उद्योगों का एक महत्वपूर्ण हिस्सा बन गया है। ऐसा ही एक कार्य जो अक्सर होता है वह डेटासेट में शब्दों को संख्याओं में परिवर्तित करना है। यह लेख चर्चा करेगा कि इस कार्य को कुशलतापूर्वक करने के लिए पायथन के शक्तिशाली पुस्तकालय, पांडा का उपयोग कैसे किया जा सकता है। हम इस समस्या को हल करने में शामिल चरणों, कोड और अवधारणाओं का पता लगाएंगे, यह सुनिश्चित करते हुए कि आप प्रक्रिया को समझते हैं और इसे आसानी से लागू कर सकते हैं।

आरंभ करने के लिए, आइए उस समस्या को समझें जिसका हम समाधान करना चाहते हैं। कल्पना कीजिए कि आपके पास शब्दों में लिखे गए कॉलम वाले डेटासेट हैं, जैसे "एक," "दो," "तीन," और इसी तरह। हमारा लक्ष्य इन शब्द संख्याओं को पायथन और पांडा का उपयोग करके उनके पूर्णांक समकक्षों में बदलना है।

चरण 1: आवश्यक पुस्तकालयों का आयात करना
इस कार्य को पूरा करने के लिए, हमें पहले आवश्यक पुस्तकालयों को आयात करना होगा। इस मामले में, हम पांडा लाइब्रेरी का उपयोग डेटा को संभालने और हेरफेर करने के लिए करेंगे, और शब्दों को संख्याओं में बदलने के लिए इन्फ्लेक्ट करेंगे।

import pandas as pd
import inflect

पांडा पुस्तकालय

पांडा एक ओपन-सोर्स डेटा हेरफेर और विश्लेषण पुस्तकालय है जो संरचित डेटा को संभालने के लिए आवश्यक डेटा संरचना और कार्य प्रदान करता है। यह पायथन प्रोग्रामिंग भाषा के शीर्ष पर बनाया गया है और डेटा प्रीप्रोसेसिंग, सफाई और विश्लेषण में महत्वपूर्ण भूमिका निभाता है। इसकी कुछ मुख्य डेटा संरचनाओं में श्रृंखला, डेटाफ़्रेम और इंडेक्स शामिल हैं, जो विभिन्न प्रकार के डेटा और संचालन से निपटने में मदद करते हैं।

पुस्तकालय को मोड़ो

इन्फ्लेक्ट एक पायथन लाइब्रेरी है जो बहुवचन और एकवचन संज्ञाओं, क्रमवाचकों की गणना करने और संख्याओं को शब्दों या शब्दों को संख्याओं में बदलने में सहायता करती है। इस लेख में, हम शब्दों को संख्याओं में बदलने की इसकी क्षमता पर ध्यान देंगे। इन्फ़्लेक्ट का उपयोग करने के लिए, आपको इसे निम्न कमांड का उपयोग करके इंस्टॉल करना होगा:

!pip install inflect

चरण 2: एक पांडा डेटाफ़्रेम बनाना
अब जब हमने आवश्यक पुस्तकालयों को आयात कर लिया है, तो शब्दों के रूप में संख्याओं वाले कॉलम के साथ एक पांडा डेटाफ़्रेम बनाते हैं। उदाहरण के लिए यह हमारे नमूना डेटासेट के रूप में काम करेगा।

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

चरण 3: शब्दों को संख्याओं में बदलना
अगला, हम शब्दों में संख्याओं को उनके पूर्णांक समकक्षों में बदलने के लिए इन्फ़्लेक्ट लाइब्रेरी का उपयोग करेंगे। हम 'कन्वर्ट_वर्ड_टू_नंबर' नामक एक फ़ंक्शन बनाएंगे जो एक शब्द को इनपुट के रूप में लेता है और संबंधित संख्या देता है।

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

इस कोड स्निपेट में, हम एक ऐसे फ़ंक्शन को परिभाषित करते हैं जो शब्दों को संख्याओं में बदलने के लिए विभक्ति इंजन का उपयोग करता है। फिर हम इस फ़ंक्शन को DataFrame में 'Numbers_in_words' कॉलम के प्रत्येक तत्व पर लागू करने के लिए पांडा लागू () विधि का उपयोग करते हैं।

संक्षेप में, हमने देखा है कि डेटासेट में शब्दों को संख्याओं में बदलने के लिए पायथन, पांडा और इन्फ्लेक्ट का उपयोग कैसे किया जा सकता है। पांडा डेटा हेरफेर के लिए एक आवश्यक उपकरण के रूप में कार्य करता है, जबकि विभक्ति पुस्तकालय शब्दों और संख्याओं से जुड़े कार्यों में सहायता करता है। इन चरणों का पालन करके, आप आसानी से अपने डेटासेट में शब्द संख्याओं को पूर्णांकों में बदल सकते हैं और अपने डेटा का और विश्लेषण और हेरफेर कर सकते हैं। हैप्पी कोडिंग!

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो