حل شدہ: لاپتہ اقدار پانڈا کو تبدیل کرنے کے لئے dict کا استعمال کریں۔

ڈیٹا ہیرا پھیری اور تجزیہ کی دنیا میں، گمشدہ اقدار کو سنبھالنا ایک اہم کام ہے۔ پانڈاسایک وسیع پیمانے پر استعمال ہونے والی Python لائبریری، ہمیں گمشدہ ڈیٹا کو مؤثر طریقے سے منظم کرنے کی اجازت دیتی ہے۔ گمشدہ اقدار سے نمٹنے کے لیے ایک عام نقطہ نظر میں ان اقدار کو نقشہ بنانے اور تبدیل کرنے کے لیے لغات کا استعمال شامل ہے۔ اس مضمون میں، ہم اس بات پر تبادلہ خیال کریں گے کہ ڈیٹاسیٹ میں گمشدہ اقدار کو تبدیل کرنے کے لیے لغات استعمال کرنے کے لیے پانڈوں اور ازگر کی طاقت کو کیسے استعمال کیا جائے۔

حل

بنیادی حل جس کی ہم تلاش کریں گے وہ استعمال کرنا ہے۔ بھرنا() لغات کے ساتھ مل کر کام کرتا ہے۔ یہ نقطہ نظر ہمیں گمشدہ اقدار کو ایک مخصوص لغت سے متعلقہ اقدار سے تبدیل کرنے کے قابل بنائے گا۔

کوڈ کی مرحلہ وار وضاحت

اس عمل کو واضح کرنے کے لیے، فرض کریں کہ ہمارے پاس ایک ڈیٹاسیٹ ہے جس میں مختلف فیشن کے انداز، بشمول لباس، رنگ، اور تاریخی سیاق و سباق کے بارے میں معلومات موجود ہیں۔ کچھ معاملات میں، اس ڈیٹاسیٹ میں قدریں غائب ہو سکتی ہیں۔

سب سے پہلے، ضروری لائبریریوں کو درآمد کریں اور ایک نمونہ ڈیٹا فریم بنائیں:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

اب جب کہ ہمارے پاس ایک ڈیٹا فریم ہے جو اس مسئلے کی وضاحت کرتا ہے، نوٹس کریں کہ کچھ قدریں غائب ہیں (کوئی نہیں سے ظاہر ہوتا ہے)۔ ان اقدار کو تبدیل کرنے کے لیے، مناسب میپنگ پر مشتمل لغات بنائیں:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

آخر میں، استعمال کریں بھرنا() مشترکہ لغت کا استعمال کرتے ہوئے گمشدہ اقدار کو تبدیل کرنے کے لئے فنکشن:

df_filled = df.fillna(replacement_dict)

پانڈوں کی لائبریری کو سمجھنا

پانڈاس Python میں ایک ورسٹائل لائبریری ہے جو ڈیٹا میں ہیرا پھیری اور تجزیہ کے لیے بنائی گئی ہے۔ یہ لچکدار اور طاقتور ڈیٹا ڈھانچہ پیش کرتا ہے جیسے سیریز اور ڈیٹا فریم۔ یہ ڈھانچے ساختی، ٹیبلر ڈیٹا کے ساتھ مؤثر طریقے سے کام کرنے کے لیے ضروری ہیں۔

پانڈا افعال کا ایک بھرپور مجموعہ فراہم کرتا ہے، جیسے بھرنا()لاپتہ ڈیٹا کو سنبھالنے کے لیے استعمال کیا جاتا ہے۔ دیگر آپریشنز، جیسے ڈیٹا کو ضم کرنا، ڈیٹا کو پیوٹنگ کرنا، اور ٹائم سیریز کا تجزیہ، پانڈوں کے ساتھ بغیر کسی رکاوٹ کے انجام دیا جا سکتا ہے۔

گمشدہ ڈیٹا کو سنبھالنے کے افعال

کے علاوہ میں بھرنا() فنکشن، پانڈاس گمشدہ ڈیٹا سے نمٹنے کے لیے کئی دیگر افعال اور طریقے پیش کرتا ہے، جیسے:

  • ڈراپنا(): غائب ڈیٹا والی قطاریں یا کالم ہٹا دیں۔
  • اسنا(): اس بات کا تعین کریں کہ کون سے ڈیٹا فریم یا سیریز کے عناصر غائب ہیں یا کالعدم ہیں۔
  • notna(): اس بات کا تعین کریں کہ کون سے ڈیٹا فریم یا سیریز کے عناصر غائب یا کالعدم نہیں ہیں۔
  • انٹرپولیٹ (): لکیری انٹرپولیشن کا استعمال کرتے ہوئے گم شدہ اقدار کو پُر کریں۔

ان طریقوں کے ساتھ ساتھ بھرنا()مختلف سیاق و سباق میں گمشدہ ڈیٹا کو سنبھالنے کے لیے ٹولز کا ایک جامع مجموعہ فراہم کریں۔

آخر میں، اس مضمون نے استعمال کرنے کا طریقہ دکھایا ہے۔ ڈک پانڈاس ڈیٹا فریم میں گم شدہ اقدار کو تبدیل کرنے کے لیے۔ کلیدی فنکشن جو ہم نے استعمال کیا، بھرنا()، پانڈاس لائبریری میں ایک طاقتور ٹول ہے جو ہمیں گمشدہ ڈیٹا کو موثر طریقے سے سنبھالنے کی اجازت دیتا ہے۔ لغات کا فائدہ اٹھا کر، ہم گمشدہ اقدار کو مناسب تبدیلیوں کے لیے نقشہ بنا سکتے ہیں اور اس بات کو یقینی بنا سکتے ہیں کہ ہمارا ڈیٹا سیٹ مکمل اور معنی خیز ہے۔ پانڈاس لائبریری اور اس میں شامل فنکشنز کے بارے میں گہری تفہیم کے ذریعے، ہم بڑے ڈیٹاسیٹس کے ساتھ مؤثر طریقے سے کام کر سکتے ہیں اور اپنے ڈیٹا سے قیمتی بصیرت حاصل کر سکتے ہیں۔

متعلقہ اشاعت:

ایک کامنٹ دیججئے