ستجد حلا: استخدم الدكت لاستبدال قيم الباندا المفقودة

في عالم معالجة البيانات وتحليلها ، يعد التعامل مع القيم المفقودة مهمة حاسمة. الباندا، مكتبة Python شائعة الاستخدام ، تتيح لنا إدارة البيانات المفقودة بكفاءة. تتضمن إحدى الطرق الشائعة للتعامل مع القيم المفقودة استخدام القواميس لتعيين هذه القيم واستبدالها. في هذه المقالة ، سنناقش كيفية الاستفادة من قوة Pandas و Python لاستخدام القواميس لاستبدال القيم المفقودة في مجموعة البيانات.

الحلول

الحل الأساسي الذي سنستكشفه هو استخدام فيلنا () تعمل بالتزامن مع القواميس. سيمكننا هذا النهج من استبدال القيم المفقودة بالقيم المقابلة من قاموس محدد.

شرح التعليمات البرمجية خطوة بخطوة

لتوضيح هذه العملية ، لنفترض أن لدينا مجموعة بيانات تحتوي على معلومات حول أنماط الموضة المختلفة ، بما في ذلك الملابس والألوان والسياق التاريخي. في بعض الحالات ، قد تكون هناك قيم مفقودة في مجموعة البيانات هذه.

أولاً ، قم باستيراد المكتبات الضرورية وإنشاء نموذج DataFrame:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

الآن بعد أن أصبح لدينا DataFrame يوضح المشكلة ، لاحظ أن بعض القيم مفقودة (يُشار إليها بواسطة None). لاستبدال هذه القيم ، قم بإنشاء قواميس تحتوي على التعيينات المناسبة:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

أخيرًا ، استخدم ملف فيلنا () لاستبدال القيم المفقودة باستخدام القاموس المدمج:

df_filled = df.fillna(replacement_dict)

فهم مكتبة الباندا

الباندا هي مكتبة متعددة الاستخدامات في Python تم تصميمها لمعالجة البيانات وتحليلها. يوفر هياكل بيانات مرنة وقوية مثل السلسلة وإطار البيانات. هذه الهياكل ضرورية للعمل بكفاءة مع البيانات المجدولة المنظمة.

يوفر Pandas مجموعة غنية من الوظائف ، مثل فيلنا ()، تستخدم لمعالجة البيانات المفقودة. يمكن إجراء عمليات أخرى ، مثل دمج البيانات ، وتمحور البيانات ، وتحليل السلاسل الزمنية ، بسلاسة باستخدام Pandas.

وظائف للتعامل مع البيانات المفقودة

بالإضافة إلى فيلنا () وظيفة ، تقدم Pandas عدة وظائف وطرق أخرى للتعامل مع البيانات المفقودة ، مثل:

  • قطرةنا (): إزالة الصفوف أو الأعمدة ذات البيانات المفقودة.
  • إسنا (): تحديد أي عناصر DataFrame أو سلسلة مفقودة أو خالية.
  • notna (): تحديد أي عناصر DataFrame أو سلسلة ليست مفقودة أو خالية.
  • تحقق(): املأ القيم المفقودة باستخدام الاستيفاء الخطي.

هذه الأساليب جنبا إلى جنب مع فيلنا ()، توفر مجموعة شاملة من الأدوات للتعامل مع البيانات المفقودة في مجموعة متنوعة من السياقات.

في الختام ، لقد أوضحت هذه المقالة كيفية استخدامها ديكت لاستبدال القيم المفقودة في Pandas DataFrame. الوظيفة الرئيسية التي استخدمناها ، فيلنا ()، هي أداة قوية في مكتبة Pandas تتيح لنا التعامل مع البيانات المفقودة بكفاءة. من خلال الاستفادة من القواميس ، يمكننا تعيين القيم المفقودة إلى البدائل المناسبة والتأكد من أن مجموعة البيانات الخاصة بنا كاملة وذات مغزى. من خلال فهم أعمق لمكتبة Pandas ووظائفها المضمنة ، يمكننا العمل مع مجموعات البيانات الكبيرة بفعالية واستخلاص رؤى قيمة من بياناتنا.

الوظائف ذات الصلة:

اترك تعليق