تم الحل: أضف أعمدة متعددة إلى إطار البيانات إذا لم تكن الباندا موجودة

Pandas هي مكتبة Python مفتوحة المصدر توفر هياكل بيانات عالية الأداء وسهلة الاستخدام وأدوات تحليل البيانات. لقد أصبح خيارًا مفضلًا للمطورين وعلماء البيانات عندما يتعلق الأمر بمعالجة البيانات وتحليلها. تتمثل إحدى الميزات القوية التي توفرها Pandas في إنشاء إطارات البيانات وتعديلها. في هذه المقالة ، سوف نستكشف عملية إضافة أعمدة متعددة إلى إطار بيانات إذا لم تكن موجودة ، وذلك باستخدام مكتبة الباندا. سنستعرض شرحًا تفصيليًا للرمز خطوة بخطوة ونتعمق في الوظائف والمكتبات والمشكلات ذات الصلة التي قد تواجهها على طول الطريق.

يعد العمل باستخدام أطر البيانات أمرًا بالغ الأهمية عند معالجة البيانات ، وغالبًا ما قد تجد نفسك في موقف تحتاج فيه إلى إضافة أعمدة متعددة في وقت واحد إلى إطار البيانات. قد يكون هذا صعبًا ، لكن مكتبة Pandas تجعل هذه المهمة سلسة وفعالة. أولاً ، لنبدأ باستيراد مكتبة Pandas:

import pandas as pd

إضافة أعمدة متعددة إلى Pandas Dataframe

لإضافة أعمدة متعددة إلى إطار بيانات ، يمكننا استخدام طريقة DataFrame.assign (). تسمح لنا هذه الطريقة بإضافة عمود أو عدة أعمدة إلى إطار البيانات مرة واحدة. لنقم بإنشاء نموذج إطار بيانات ثم نضيف أعمدة متعددة إليه إذا لم تكن موجودة بالفعل:

# Create a sample dataframe
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)

# Add multiple columns if they do not exist
new_columns = ['column3', 'column4']
for new_col in new_columns:
    if new_col not in df.columns:
        df[new_col] = None

في مجلة مقتطف الشفرة أعلاه، نقوم أولاً بإنشاء نموذج إطار بيانات بعمودين ، "عمود 1" و "عمود 2". نقوم بعد ذلك بإنشاء قائمة بالأعمدة الجديدة ، "العمود 3" و "العمود 4" ، التي نريد إضافتها إلى إطار البيانات. أخيرًا ، نكرر قائمة الأعمدة ونضيف عمودًا جديدًا إذا لم يكن موجودًا بالفعل في إطار البيانات.

شرح خطوة بخطوة

إليك خطوة خطوة شرح كل جزء من حلنا:

1. نبدأ باستيراد مكتبة الباندا باستخدام "استيراد الباندا كـ pd".
2. بعد ذلك ، نقوم بإنشاء نموذج إطار بيانات يسمى "df" مع عمودين: "عمود 1" و "عمود 2".
3. نقوم بإنشاء قائمة بالأعمدة الجديدة التي نريد إضافتها إلى إطار البيانات - "عمود 3" و "عمود 4".
4. نستخدم حلقة for للتكرار خلال قائمة الأعمدة الجديدة.
5. داخل الحلقة ، نتحقق مما إذا كان العمود الجديد موجودًا بالفعل في إطار البيانات باستخدام الحالة "ليس في". في حالة عدم وجود العمود الجديد ، نضيف العمود الجديد إلى إطار البيانات بقيمة افتراضية بلا.

وظائف ومكتبات الباندا

تقدم Pandas مجموعة واسعة من الوظائف والأساليب التي تبسط التعامل مع أطر البيانات ومعالجتها. في حلنا ، استخدمنا المكونات الرئيسية التالية:

  • DataFrame - باعتباره هيكل البيانات الأساسي في الباندا ، فإن DataFrame عبارة عن بيانات جدولية ثنائية الأبعاد ، قابلة للتغيير ، ومن المحتمل أن تكون غير متجانسة مع محاور محددة (صفوف وأعمدة)
  • أعمدة DataFrame.columns - تقوم هذه السمة بإرجاع تسميات أعمدة DataFrame ، مما يسمح لنا بالوصول والتحقق من وجود عمود أم لا.
  • pd.DataFrame () - إنها وظيفة المنشئ لإنشاء إطار بيانات جديد. يسمح لك بتحديد أسماء البيانات والأعمدة أثناء الإنشاء.

الآن بعد أن أصبح لديك فهم أفضل لكيفية القيام بذلك إضافة أعمدة متعددة بالنسبة إلى إطار بيانات Pandas ، ستساعدك هذه التقنية في إدارة البيانات ومعالجتها بكفاءة. تذكر أن Pandas تقدم العديد من الميزات القوية الأخرى لتحليل البيانات ومعالجتها ، لذا تأكد من استكشافها أيضًا لتصبح مطور Python أكثر فاعلية.

الوظائف ذات الصلة:

اترك تعليق