ستجد حلا: تصفية جميع الأعمدة في الباندا

في عالم تحليل البيانات ، قد يكون التعامل مع مجموعات البيانات الكبيرة مهمة شاقة. أحد الأجزاء الأساسية في هذه العملية هو تصفية البيانات للحصول على المعلومات ذات الصلة. عندما يتعلق الأمر ببايثون ، المكتبة القوية الباندا يأتي لمساعدتنا. في هذه المقالة سوف نناقش كيفية تصفية جميع الأعمدة في الباندا DataFrame. سنستعرض شرحًا تفصيليًا للشفرة ونقدم فهمًا عميقًا للمكتبات والوظائف التي يمكن استخدامها لحل مشكلات مماثلة.

إدخال الباندا

هي مكتبة مفتوحة المصدر توفر هياكل بيانات سهلة الاستخدام وأدوات تحليل بيانات للغة برمجة Python. إنها تلعب دورًا مهمًا في النظام البيئي لعلوم البيانات وقد أصبحت أداة لا غنى عنها لأي عالم بيانات أو محلل يعمل مع Python. من بين ميزاتها ، تقدم الباندا هيكلين أساسيين للبيانات: DataFrame و مسلسلات. إن DataFrame هو جدول ثنائي الأبعاد يحتوي على محاور مسماة (صفوف وأعمدة) ، بينما السلسلة عبارة عن مصفوفة ذات بعد واحد.

بالنسبة لهذه المقالة ، سنركز على تصفية قيم محددة موجودة في أي عمود من أعمدة بيانات الباندا. للقيام بذلك ، سوف نستخدم الباندا .في داخل() تعمل جنبا إلى جنب مع اخفاء منطقي.

تصفية DataFrame

لتصفية DataFrame في الباندا ، اتبع الخطوات التالية:

1. استيراد مكتبة الباندا
2. قم بإنشاء DataFrame أو تحميله من ملف
3. حدد القيم التي تريد تصفيتها
4. قم بتطبيق المرشح باستخدام وظيفة `.isin ()` والاخفاء المنطقي
5. اعرض DataFrame الذي تمت تصفيته

دعنا نتعمق في الكود لفهم كيفية عمله.

import pandas as pd

# Creating a DataFrame
data = {'Column1': [1, 2, 3, 4, 5],
        'Column2': [10, 20, 30, 40, 50],
        'Column3': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)

# Define the values to filter
filter_values = [1, 3, 5, 'A']

# Apply the filter using .isin() and boolean masking
filtered_df = df[df.isin(filter_values).any(axis=1)]

# Display the filtered DataFrame
print(filtered_df)

في هذا المثال ، نقوم أولاً باستيراد مكتبة الباندا وإنشاء DataFrame بثلاثة أعمدة. نحدد القيم التي نريد ترشيحها (1 و 3 و 5 و 'A') ونطبق المرشح باستخدام وظيفة `.isin ()` جنبًا إلى جنب مع الإخفاء المنطقي. تتحقق الوظيفة `أي (محور = 1)` مما إذا كانت أي قيمة داخل صف تفي بمعايير التصفية. أخيرًا ، نقوم بطباعة DataFrame الذي تمت تصفيته.

وظيفة .isin () والإخفاء المنطقي

.في داخل() الوظيفة في الباندا هي أداة متعددة الاستخدامات لتصفية البيانات بناءً على قائمة أو مجموعة من القيم. تقوم بإرجاع إطار بيانات منطقي له نفس الشكل الأصلي ، مما يشير إلى العناصر الموجودة في القائمة أو المجموعة المتوفرة. في حالتنا ، نقوم بتمرير قائمة القيم التي نريد تصفيتها.

الإخفاء المنطقي هو تقنية مستخدمة في الباندا لتصفية البيانات حسب العناصر. وهو يتألف من تطبيق قناع منطقي (مجموعة من القيم الحقيقية والخطأ) على بنية بيانات لتصفية عناصرها. في سياق مشكلتنا ، نستخدم إخفاء منطقي مع وظيفة .isin () لاسترداد الصفوف التي تحتوي على القيم المطلوبة.

من خلال الفهم الواضح لمكتبة الباندا ، وهياكل DataFrame ، ووظيفة .isin () ، يمكننا بشكل فعال تصفية أي Pandas DataFrame. تسمح لنا هذه التقنيات باستكشاف مجموعات البيانات الكبيرة واستخراج رؤى قيمة بسهولة ، مما يجعل الباندا مكتبة عامة لتحليل البيانات في بايثون.

الوظائف ذات الصلة:

اترك تعليق