সমাধান করা হয়েছে: অনুপস্থিত মান পান্ডা প্রতিস্থাপন করতে dict ব্যবহার করুন

ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের জগতে, অনুপস্থিত মানগুলি পরিচালনা করা একটি গুরুত্বপূর্ণ কাজ। পান্ডাস, একটি ব্যাপকভাবে ব্যবহৃত পাইথন লাইব্রেরি, আমাদেরকে নিখোঁজ ডেটা দক্ষতার সাথে পরিচালনা করতে দেয়। অনুপস্থিত মানগুলির সাথে মোকাবিলা করার একটি সাধারণ পদ্ধতির মধ্যে এই মানগুলি মানচিত্র এবং প্রতিস্থাপনের জন্য অভিধান ব্যবহার করা জড়িত। এই নিবন্ধে, আমরা আলোচনা করব কিভাবে একটি ডেটাসেটে অনুপস্থিত মান প্রতিস্থাপনের জন্য অভিধান ব্যবহার করার জন্য পান্ডা এবং পাইথনের শক্তি ব্যবহার করা যায়।

সমাধান

প্রাথমিক সমাধান আমরা অন্বেষণ করব ব্যবহার করে fillna() অভিধানের সাথে একযোগে ফাংশন। এই পদ্ধতিটি আমাদেরকে একটি নির্দিষ্ট অভিধান থেকে অনুপস্থিত মানগুলিকে সংশ্লিষ্ট মানগুলির সাথে প্রতিস্থাপন করতে সক্ষম করবে।

কোডের ধাপে ধাপে ব্যাখ্যা

এই প্রক্রিয়াটি ব্যাখ্যা করার জন্য, ধরুন আমাদের কাছে পোশাক, রঙ এবং ঐতিহাসিক প্রেক্ষাপট সহ বিভিন্ন ফ্যাশন শৈলী সম্পর্কে তথ্য সম্বলিত একটি ডেটাসেট রয়েছে। কিছু ক্ষেত্রে, এই ডেটাসেটে অনুপস্থিত মান থাকতে পারে।

প্রথমত, প্রয়োজনীয় লাইব্রেরি আমদানি করুন এবং একটি নমুনা ডেটাফ্রেম তৈরি করুন:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

এখন যেহেতু আমাদের কাছে একটি ডেটাফ্রেম রয়েছে যা সমস্যাটি চিত্রিত করে, লক্ষ্য করুন যে কিছু মান অনুপস্থিত (কোনটি দ্বারা চিহ্নিত করা হয়নি)। এই মানগুলি প্রতিস্থাপন করতে, উপযুক্ত ম্যাপিং সম্বলিত অভিধান তৈরি করুন:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

অবশেষে, ব্যবহার করুন fillna() সম্মিলিত অভিধান ব্যবহার করে অনুপস্থিত মান প্রতিস্থাপন করার ফাংশন:

df_filled = df.fillna(replacement_dict)

পান্ডাস লাইব্রেরি বোঝা

পান্ডাস পাইথনের একটি বহুমুখী লাইব্রেরি যা ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের জন্য ডিজাইন করা হয়েছে। এটি সিরিজ এবং ডেটাফ্রেমের মতো নমনীয় এবং শক্তিশালী ডেটা স্ট্রাকচার অফার করে। স্ট্রাকচার্ড, ট্যাবুলার ডেটার সাথে দক্ষতার সাথে কাজ করার জন্য এই কাঠামোগুলি অপরিহার্য।

পান্ডা ফাংশনের একটি সমৃদ্ধ সংগ্রহ প্রদান করে, যেমন fillna(), অনুপস্থিত ডেটা পরিচালনার জন্য ব্যবহৃত হয়। অন্যান্য ক্রিয়াকলাপ, যেমন ডেটা মার্জিং, পিভটিং ডেটা, এবং সময়-সিরিজ বিশ্লেষণ, পান্ডাদের সাথে নির্বিঘ্নে সম্পাদন করা যেতে পারে।

অনুপস্থিত ডেটা পরিচালনার জন্য ফাংশন

ছাড়াও fillna() ফাংশন, পান্ডাস অনুপস্থিত ডেটা মোকাবেলার জন্য অন্যান্য বেশ কয়েকটি ফাংশন এবং পদ্ধতি অফার করে, যেমন:

  • ড্রপনা(): অনুপস্থিত ডেটা সহ সারি বা কলামগুলি সরান৷
  • ইসনা(): কোন ডেটাফ্রেম বা সিরিজ উপাদান অনুপস্থিত বা শূন্য তা নির্ধারণ করুন।
  • notna(): কোন ডেটাফ্রেম বা সিরিজ উপাদানগুলি অনুপস্থিত বা শূন্য নয় তা নির্ধারণ করুন।
  • ইন্টারপোলেট(): লিনিয়ার ইন্টারপোলেশন ব্যবহার করে অনুপস্থিত মান পূরণ করুন।

এই পদ্ধতি, বরাবর fillna(), বিভিন্ন প্রসঙ্গে অনুপস্থিত ডেটা পরিচালনা করার জন্য সরঞ্জামগুলির একটি বিস্তৃত স্যুট প্রদান করুন।

উপসংহারে, এই নিবন্ধটি কীভাবে ব্যবহার করতে হয় তা প্রদর্শন করেছে ডিক একটি পান্ডাস ডেটাফ্রেমে অনুপস্থিত মান প্রতিস্থাপন করতে। আমরা নিযুক্ত মূল ফাংশন, fillna(), পান্ডাস লাইব্রেরির একটি শক্তিশালী টুল যা আমাদের অনুপস্থিত ডেটা দক্ষতার সাথে পরিচালনা করতে দেয়। অভিধান ব্যবহার করে, আমরা অনুপস্থিত মানগুলিকে যথাযথ প্রতিস্থাপনে ম্যাপ করতে পারি এবং নিশ্চিত করতে পারি যে আমাদের ডেটাসেট সম্পূর্ণ এবং অর্থবহ। পান্ডাস লাইব্রেরি এবং এর অন্তর্ভুক্ত ফাংশনগুলির গভীর বোঝার মাধ্যমে, আমরা কার্যকরভাবে বড় ডেটাসেটের সাথে কাজ করতে পারি এবং আমাদের ডেটা থেকে মূল্যবান অন্তর্দৃষ্টি আঁকতে পারি।

সম্পর্কিত পোস্ট:

মতামত দিন