تم الحل: قم بتحديث الخلية في الورقة حسب اسم العمود باستخدام الباندا

في عالم تحليل البيانات ، يعد استخدام جداول البيانات أمرًا شائعًا ، خاصة عند العمل مع البيانات المهيكلة بتنسيق عمودي. تعد Pandas واحدة من المكتبات الشائعة للعمل مع بيانات جداول البيانات في Python. تتيح هذه المكتبة القوية للمطورين قراءة البيانات الجدولية ومعالجتها وتصديرها بسهولة. في هذه المقالة ، سنركز على مشكلة محددة: تحديث الخلايا في ورقة حسب اسم العمود باستخدام Pandas. سنتعمق في الحل ، متبوعًا بشرح خطوة بخطوة للشفرة ، وأخيرًا نناقش المفاهيم والوظائف ذات الصلة في Pandas ، مثل العمل مع الفهارس واختيار البيانات. اذا هيا بنا نبدأ.

تحديث الخلايا حسب اسم العمود باستخدام الباندا

لتحديث الخلايا في ورقة حسب اسم العمود ، نحتاج أولاً إلى تثبيت مكتبة Pandas إذا لم تكن مثبتة بالفعل باستخدام الأمر التالي:

!pip install pandas

مع تثبيت Pandas ، دعنا نحدد الخطوات لتحديث الخلايا في ورقة حسب اسم العمود:

1. قم بتحميل الورقة في كائن DataFrame.
2. قم بالوصول إلى الخلايا التي نريد تحديثها.
3. قم بتعديل الخلايا المرغوبة عن طريق تعيين قيم جديدة.
4. احفظ كائن DataFrame مرة أخرى إلى الورقة.

إليك مقتطف الشفرة الذي يوضح الحل بمثال بسيط:

import pandas as pd

# Load data from a CSV file into a DataFrame object
df = pd.read_csv('your_spreadsheet.csv')

# Access and update the desired cells - let's update column 'Age' by adding 1 to each value
df['Age'] = df['Age'] + 1

# Save the updated DataFrame back to the CSV file
df.to_csv('your_updated_spreadsheet.csv', index=False)

فهم المدونة

الخطوة الأولى هي استيراد مكتبة Pandas تحت الاسم المستعار `pd`. بعد ذلك ، يتعين علينا تحميل البيانات من ملف CSV إلى كائن DataFrame باستخدام الوظيفة `` pd.read_csv () `، وتحديد اسم ملف الإدخال ('your_spreadsheet.csv').

الآن يأتي الجزء الرئيسي من المشكلة: الوصول إلى الخلايا المرغوبة وتحديثها. في هذا المثال ، نريد تحديث عمود "العمر" عن طريق إضافة 1 إلى كل قيمة في العمود. نقوم بذلك ببساطة عن طريق إضافة 1 إلى عمود "Age" ، والذي يتم الوصول إليه باستخدام بناء الجملة df ['Age'] `. ستؤدي هذه الشفرة إضافة عنصر واحد إلى كل عنصر في عمود "العمر".

أخيرًا ، نقوم بحفظ DataFrame المحدث مرة أخرى إلى ملف CSV باستخدام الوظيفة `` df.to_csv () `مع اسم ملف الإخراج ('your_updated_spreadsheet.csv'). يتم استخدام المعلمة `index = False` لتجنب كتابة أرقام الصفوف في ملف الإخراج.

فهارس الباندا وتحديد البيانات

تعتمد Pandas بشكل كبير على مفهوم الفهارس لاختيار البيانات ومعالجتها. بشكل افتراضي ، عند تحميل البيانات من ملف ، تقوم Pandas بتعيين ملف فهرس رقمي لكل صف في DataFrame ، بدءًا من 0. عند العمل مع البيانات في Pandas ، من الضروري فهم الطرق المختلفة لـ اختيار البيانات وتصفيتها بناءً على قيم الفهرس أو أسماء الأعمدة.

على سبيل المثال ، لتحديد صف أو صفوف معينة ، يمكنك استخدام مفهرس `iloc` ، والذي يسمح لك بالوصول إلى الصفوف بناءً على فهرس الأعداد الصحيحة:

# Select the first row of the DataFrame
first_row = df.iloc[0]

# Select rows 1 to 3 (excluding 3)
rows_1_to_2 = df.iloc[1:3]

عندما تحتاج إلى تحديث الخلايا بناءً على حالة معينة ، مثل تحديث عمود "العمر" فقط لتلك الصفوف حيث يكون لعمود آخر (على سبيل المثال ، "المدينة") قيمة معينة ، يمكنك استخدام الفهرسة المنطقية:

# Update the 'Age' column by adding 1, only for rows where 'City' is equal to 'New York'
df.loc[df['City'] == 'New York', 'Age'] = df['Age'] + 1

في هذا المثال ، يتم استخدام مفهرس `loc` لتحديد الصفوف بناءً على شرط منطقي ، ثم يتم تحديث عمود" العمر ".

ضع في اعتبارك أن هذا مجرد غيض من فيض عندما يتعلق الأمر بالعمل مع البيانات في Pandas. توفر المكتبة عددًا كبيرًا من الوظائف والتقنيات لمعالجة بياناتك وتحليلها وتصورها بكفاءة. يضع فهم الأساسيات ، مثل تحديث الخلايا في ورقة حسب اسم العمود ، أساسًا قويًا للعمل مع هياكل البيانات الأكثر تعقيدًا ومهام التحليل في المستقبل.

الوظائف ذات الصلة:

اترك تعليق