সমাধান করা হয়েছে: পাইথন পান্ডায় শব্দকে সংখ্যায় কীভাবে রূপান্তর করা যায়

আজকের বিশ্বে, ডেটা ম্যানিপুলেশন এবং বিশ্লেষণ বিভিন্ন শিল্পের একটি গুরুত্বপূর্ণ অংশ হয়ে উঠেছে। এমন একটি কাজ যা প্রায়শই ঘটে তা হল ডেটাসেটে শব্দকে সংখ্যায় রূপান্তর করা। এই নিবন্ধটি আলোচনা করবে কিভাবে পাইথনের শক্তিশালী লাইব্রেরি, পান্ডা, এই কাজটি দক্ষতার সাথে করতে ব্যবহার করা যেতে পারে। আমরা এই সমস্যাটি সমাধানের সাথে জড়িত পদক্ষেপ, কোড এবং ধারণাগুলি অন্বেষণ করব, আপনি প্রক্রিয়াটি উপলব্ধি করতে পারেন এবং এটি সহজেই বাস্তবায়ন করতে পারেন তা নিশ্চিত করে।

শুরুতে, আসুন আমরা বুঝতে পারি যে সমস্যাটি আমরা সমাধান করতে চাই। কল্পনা করুন আপনার কাছে "এক," "দুই," "তিন" ইত্যাদির মতো শব্দে লেখা নম্বর সহ একটি কলাম সহ একটি ডেটাসেট আছে। আমাদের লক্ষ্য হল পাইথন এবং পান্ডা ব্যবহার করে এই শব্দ সংখ্যাগুলিকে তাদের পূর্ণসংখ্যার অংশে রূপান্তর করা।

ধাপ 1: প্রয়োজনীয় লাইব্রেরি আমদানি করা
এই কাজটি সম্পন্ন করার জন্য, আমাদের প্রথমে প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করতে হবে। এই ক্ষেত্রে, আমরা ডাটা পরিচালনা এবং ম্যানিপুলেট করার জন্য পান্ডাস লাইব্রেরি ব্যবহার করব এবং শব্দগুলিকে সংখ্যায় রূপান্তর করার জন্য ইনফ্লেক্ট করব।

import pandas as pd
import inflect

পান্ডাস লাইব্রেরি

পান্ডাস হল একটি ওপেন সোর্স ডেটা ম্যানিপুলেশন এবং বিশ্লেষণ লাইব্রেরি যা স্ট্রাকচার্ড ডেটা পরিচালনার জন্য প্রয়োজনীয় ডেটা স্ট্রাকচার এবং ফাংশন প্রদান করে। এটি পাইথন প্রোগ্রামিং ভাষার উপরে নির্মিত এবং ডেটা প্রিপ্রসেসিং, পরিষ্কার এবং বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে। এর কিছু প্রধান ডেটা স্ট্রাকচারের মধ্যে রয়েছে সিরিজ, ডেটাফ্রেম এবং ইনডেক্স, যা বিভিন্ন ডাটা টাইপ এবং অপারেশনের সাথে ডিল করতে সাহায্য করে।

ইনফ্লেক্ট লাইব্রেরি

ইনফ্লেক্ট হল একটি পাইথন লাইব্রেরি যা বহুবচন এবং একবচন বিশেষ্য, অর্ডিনাল এবং সংখ্যাকে শব্দে বা শব্দকে সংখ্যায় রূপান্তর করতে সাহায্য করে। এই নিবন্ধে, আমরা শব্দগুলিকে সংখ্যায় রূপান্তর করার ক্ষমতার উপর ফোকাস করব। ইনফ্লেক্ট ব্যবহার করতে, আপনাকে নিম্নলিখিত কমান্ডটি ব্যবহার করে এটি ইনস্টল করতে হবে:

!pip install inflect

ধাপ 2: একটি পান্ডা ডেটাফ্রেম তৈরি করা
এখন যেহেতু আমরা প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করেছি, আসুন শব্দ হিসাবে সংখ্যা সম্বলিত একটি কলাম সহ একটি পান্ডাস ডেটাফ্রেম তৈরি করি। এটি উদাহরণের উদ্দেশ্যে আমাদের নমুনা ডেটাসেট হিসাবে কাজ করবে।

data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)

ধাপ 3: শব্দকে সংখ্যায় রূপান্তর করা
এর পরে, আমরা ইনফ্লেক্ট লাইব্রেরি ব্যবহার করব শব্দের সংখ্যাগুলিকে তাদের পূর্ণসংখ্যার প্রতিরূপগুলিতে রূপান্তর করতে। আমরা 'convert_word_to_number' নামে একটি ফাংশন তৈরি করব যেটি একটি শব্দকে ইনপুট হিসেবে নেয় এবং সংশ্লিষ্ট নম্বর প্রদান করে।

def convert_word_to_number(word):
    p = inflect.engine()
    try:
        return p.singular_noun(word)
    except:
        return None

df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)

এই কোড স্নিপেটে, আমরা একটি ফাংশন সংজ্ঞায়িত করি যা শব্দগুলিকে সংখ্যায় রূপান্তর করতে ইনফ্লেক্ট ইঞ্জিন ব্যবহার করে। আমরা তখন ডাটাফ্রেমের 'Numbers_in_words' কলামের প্রতিটি উপাদানে এই ফাংশনটি প্রয়োগ করতে pandas apply() পদ্ধতি ব্যবহার করি।

সংক্ষেপে, আমরা দেখেছি কিভাবে পাইথন, পান্ডা এবং ইনফ্লেক্ট একটি ডেটাসেটে শব্দকে সংখ্যায় রূপান্তর করতে ব্যবহার করা যেতে পারে। পান্ডাস ডেটা ম্যানিপুলেশনের জন্য একটি অপরিহার্য হাতিয়ার হিসাবে কাজ করে, যখন ইনফ্লেক্ট লাইব্রেরি শব্দ এবং সংখ্যা জড়িত অপারেশনগুলিতে সহায়তা করে। এই পদক্ষেপগুলি অনুসরণ করে, আপনি সহজেই আপনার ডেটাসেটে শব্দ সংখ্যাগুলিকে পূর্ণসংখ্যাতে রূপান্তর করতে পারেন এবং আপনার ডেটা আরও বিশ্লেষণ এবং ম্যানিপুলেট করতে পারেন। শুভ কোডিং!

সম্পর্কিত পোস্ট:

মতামত দিন