Pandas ایک اوپن سورس Python لائبریری ہے جو اعلیٰ کارکردگی، استعمال میں آسان ڈیٹا ڈھانچے، اور ڈیٹا تجزیہ کے ٹولز فراہم کرتی ہے۔ جب ڈیٹا میں ہیرا پھیری اور تجزیہ کی بات آتی ہے تو یہ ڈویلپرز اور ڈیٹا سائنسدانوں کے لیے ایک بہترین انتخاب بن گیا ہے۔ پانڈوں کے ذریعہ فراہم کردہ طاقتور خصوصیات میں سے ایک ڈیٹا فریم بنانا اور اس میں ترمیم کرنا ہے۔ اس مضمون میں، ہم پانڈا لائبریری کا استعمال کرتے ہوئے، ڈیٹا فریم میں متعدد کالموں کو شامل کرنے کے عمل کو تلاش کریں گے اگر وہ موجود نہیں ہیں۔ ہم کوڈ کی مرحلہ وار وضاحت کے ذریعے چلیں گے اور متعلقہ فنکشنز، لائبریریوں اور ان مسائل کا جائزہ لیں گے جن کا آپ کو راستے میں سامنا ہو سکتا ہے۔
ڈیٹا فریم کے ساتھ کام کرنا ڈیٹا کو سنبھالتے وقت بہت ضروری ہے، اور اکثر آپ خود کو ایسی صورتحال میں پا سکتے ہیں جہاں آپ کو ڈیٹا فریم میں ایک ساتھ متعدد کالم شامل کرنے کی ضرورت ہوتی ہے۔ یہ مشکل ہوسکتا ہے، لیکن پانڈاس لائبریری اس کام کو ہموار اور موثر بناتی ہے۔ سب سے پہلے، آئیے پانڈاس لائبریری کو درآمد کرکے شروع کریں:
import pandas as pd
مواد
پانڈاس ڈیٹا فریم میں ایک سے زیادہ کالم شامل کرنا
ڈیٹا فریم میں متعدد کالم شامل کرنے کے لیے، ہم DataFrame.assign() طریقہ استعمال کر سکتے ہیں۔ یہ طریقہ ہمیں ڈیٹا فریم میں ایک ساتھ ایک یا کئی کالم شامل کرنے کی اجازت دیتا ہے۔ آئیے ایک نمونہ ڈیٹا فریم بنائیں اور پھر اس میں متعدد کالم شامل کریں اگر وہ پہلے سے موجود نہیں ہیں:
# Create a sample dataframe data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]} df = pd.DataFrame(data) # Add multiple columns if they do not exist new_columns = ['column3', 'column4'] for new_col in new_columns: if new_col not in df.columns: df[new_col] = None
میں اوپر کوڈ کا ٹکڑاہم سب سے پہلے دو کالمز، 'کالم1' اور 'کالم2' کے ساتھ ایک نمونہ ڈیٹا فریم بناتے ہیں۔ پھر ہم نئے کالموں کی فہرست بناتے ہیں، 'کالم 3' اور 'کالم4'، جسے ہم ڈیٹا فریم میں شامل کرنا چاہتے ہیں۔ آخر میں، ہم کالموں کی فہرست کے ذریعے اعادہ کرتے ہیں اور اگر ڈیٹا فریم میں پہلے سے موجود نہیں ہے تو ایک نیا کالم شامل کرتے ہیں۔
مرحلہ وار وضاحت
یہاں ایک قدم بہ قدم ہے۔ ہر حصے کی وضاحت ہمارے حل کے:
1. ہم پانڈا لائبریری کو درآمد کرتے ہوئے "پی ڈی کے طور پر پانڈوں کو درآمد کریں" کا استعمال کرتے ہوئے شروع کرتے ہیں۔
2. اگلا، ہم دو کالموں کے ساتھ 'df' نامی ایک نمونہ ڈیٹا فریم بناتے ہیں: 'column1' اور 'column2'۔
3. ہم نئے کالموں کی فہرست بناتے ہیں جنہیں ہم ڈیٹا فریم میں شامل کرنا چاہتے ہیں - 'کالم3' اور 'کالم4'۔
4. ہم نئے کالموں کی فہرست میں اعادہ کرنے کے لیے لوپ کا استعمال کرتے ہیں۔
5. لوپ کے اندر، ہم چیک کرتے ہیں کہ آیا ڈیٹا فریم میں 'not in' حالت کا استعمال کرتے ہوئے نیا کالم پہلے سے موجود ہے۔ اگر نیا کالم موجود نہیں ہے تو ہم نئے کالم کو ڈیٹا فریم میں None کی ڈیفالٹ ویلیو کے ساتھ شامل کرتے ہیں۔
پانڈوں کے افعال اور لائبریریاں
پانڈاس فنکشنز اور طریقوں کی ایک وسیع رینج پیش کرتا ہے جو ڈیٹا فریموں کو ہینڈلنگ اور جوڑ توڑ کو آسان بناتا ہے۔ ہمارے حل میں، ہم نے درج ذیل کلیدی اجزاء کا استعمال کیا:
- ڈیٹا فریم - پانڈا میں بنیادی ڈیٹا ڈھانچہ کے طور پر، ڈیٹا فریم ایک دو جہتی، تغیر پذیر، ممکنہ طور پر متضاد ٹیبلولر ڈیٹا ہے جس میں لیبل لگے ہوئے محور (قطاریں اور کالم) ہیں۔
- DataFrame.columns - یہ وصف ڈیٹا فریم کے کالم لیبلز کو لوٹاتا ہے، جس سے ہمیں رسائی اور تصدیق کرنے کی اجازت ملتی ہے کہ آیا کالم موجود ہے یا نہیں۔
- pd.DataFrame() - یہ ایک نیا ڈیٹا فریم بنانے کے لیے کنسٹرکٹر فنکشن ہے۔ یہ آپ کو تخلیق کے دوران ڈیٹا اور کالم کے ناموں کی وضاحت کرنے کی اجازت دیتا ہے۔
اب جب کہ آپ کو بہتر طریقے سے سمجھ آ گئی ہے۔ متعدد کالم شامل کریں۔ پانڈاس ڈیٹا فریم میں، یہ تکنیک آپ کو ڈیٹا کو مؤثر طریقے سے منظم کرنے اور اس میں ہیرا پھیری کرنے میں مدد کرے گی۔ یاد رکھیں کہ پانڈاس ڈیٹا کے تجزیے اور ہیرا پھیری کے لیے متعدد دیگر طاقتور خصوصیات پیش کرتا ہے، اس لیے زیادہ موثر Python ڈویلپر بننے کے لیے ان کو بھی دریافت کرنا یقینی بنائیں۔