या लेखात, आम्ही डेटा हाताळणी आणि विश्लेषणासाठी Python मधील लोकप्रिय लायब्ररी, Pandas DataFrame मध्ये नवीन स्तंभ जोडण्याची प्रक्रिया एक्सप्लोर करू. आम्ही या समस्येच्या निराकरणावर चर्चा करू, कोडचे चरण-दर-चरण स्पष्टीकरण पाहू आणि पांडा लायब्ररीमधील काही संबंधित विषय आणि कार्ये समाविष्ट करू. Pandas हे उच्च-स्तरीय डेटा स्ट्रक्चर्स आणि साधने वैशिष्ट्यीकृत करणारी व्यापकपणे वापरली जाणारी लायब्ररी आहे, कार्यक्षम डेटा विश्लेषण आणि हाताळणीसाठी योग्य.
सुरुवातीला, आपण असे गृहीत धरू की आमच्याकडे Pandas DataFrame च्या स्वरूपात डेटासेट आहे आणि आम्हाला त्यात एक नवीन कॉलम जोडायचा आहे. डेटा तयार करण्याच्या टप्प्यात ही एक सामान्य आवश्यकता आहे, बहुतेकदा वैशिष्ट्य अभियांत्रिकीसाठी किंवा विद्यमान स्तंभांवर आधारित अतिरिक्त माहिती व्युत्पन्न करण्यासाठी आवश्यक असते. हे कसे साध्य करता येईल ते पाहू या.
Pandas DataFrame मध्ये नवीन स्तंभ जोडत आहे
आम्ही आवश्यक लायब्ररी आयात करून आणि नमुना डेटाफ्रेम तयार करून प्रारंभ करू.
import pandas as pd data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']} df = pd.DataFrame(data)
आता, डीफॉल्ट व्हॅल्यूसह आमच्या डेटाफ्रेममध्ये नवीन कॉलम 'देश' जोडूया, 'यूएसए' म्हणा.
df['Country'] = 'USA'
कोडची ही साधी ओळ आमच्या विद्यमान डेटाफ्रेम 'df' मध्ये 'देश' नावाचा नवीन स्तंभ त्याच्या सर्व पंक्तींमध्ये 'USA' मूल्यासह जोडेल. आमची अपडेट केलेली डेटाफ्रेम यासारखी दिसेल:
Name Age City Country 0 Alex 25 NY USA 1 Tom 28 LA USA 2 Nick 23 SF USA 3 Sam 22 Chicago USA
चरण-दर-चरण कोड स्पष्टीकरण
चला कोड खाली मोडू आणि ते चरण-दर-चरण समजून घेऊ.
1. प्रथम, आम्ही मानक उर्फ 'pd' वापरून Pandas लायब्ररी आयात करतो. हे आम्हाला 'pd' उपसर्ग वापरून Pandas फंक्शन्स आणि क्लासेसमध्ये प्रवेश करण्यास अनुमती देते.
import pandas as pd
2. पुढे, आम्ही काही नमुना डेटा असलेला शब्दकोश 'डेटा' तयार करतो. शब्दकोशातील प्रत्येक की स्तंभाचे नाव दर्शवते आणि त्याचे संबंधित मूल्य त्या स्तंभासाठी मूल्यांची सूची असते.
data = {'Name': ['Alex', 'Tom', 'Nick', 'Sam'], 'Age': [25, 28, 23, 22], 'City': ['NY', 'LA', 'SF', 'Chicago']}
3. त्यानंतर आम्ही `pd.DataFrame()` फंक्शन वापरून हा शब्दकोश Pandas DataFrame ऑब्जेक्टमध्ये रूपांतरित करतो.
df = pd.DataFrame(data)
4. शेवटी, नवीन कॉलम जोडण्यासाठी, आम्ही डेटाफ्रेमसह असाइनमेंट ऑपरेटर “=” वापरतो, स्क्वेअर ब्रॅकेटमध्ये नवीन कॉलमचे नाव प्रदान करतो आणि डीफॉल्ट मूल्य निर्दिष्ट करतो. आमच्या बाबतीत, आम्ही डीफॉल्ट मूल्य 'यूएसए' सह 'देश' स्तंभ जोडला.
df['Country'] = 'USA'
पांडा लायब्ररी आणि संबंधित कार्ये
Pandas एक शक्तिशाली Python लायब्ररी आहे, विशेषतः डेटा प्रोसेसिंग, साफसफाई आणि विश्लेषण कार्यांसाठी उपयुक्त. हे दोन मुख्य डेटा संरचना प्रदान करते: डेटाफ्रेम आणि मालिका. डेटाफ्रेम ही लेबल केलेल्या अक्षांसह (पंक्ती आणि स्तंभ) द्विमितीय सारणी डेटा संरचना आहे. एक मालिका, दुसरीकडे, एक-आयामी लेबल केलेली अॅरे आहे जी कोणत्याही प्रकारचा डेटा ठेवण्यास सक्षम आहे.
डेटाफ्रेममध्ये कॉलम जोडणे, बदलणे आणि हटवणे संबंधित काही सामान्य पांडा फंक्शन्स खालीलप्रमाणे आहेत:
- घाला(): निर्दिष्ट स्थानावर स्तंभ घालण्यासाठी.
- थेंब(): डेटाफ्रेममधून कॉलम काढण्यासाठी.
- नाव बदला(): डेटाफ्रेमच्या स्तंभाचे नाव बदलण्यासाठी.
- नियुक्त करा(): अभिव्यक्तीच्या परिणामावर आधारित नवीन स्तंभ तयार करणे.
त्यामुळे, Pandas DataFrame मध्ये नवीन स्तंभ जोडणे सोपे आणि कार्यक्षम आहे. या लेखात, आम्ही डीफॉल्ट मूल्यासह नवीन स्तंभ जोडण्याची मूलभूत पद्धत समाविष्ट केली आहे आणि त्यात समाविष्ट असलेल्या चरणांसाठी तपशीलवार स्पष्टीकरण दिले आहे. आम्ही पांडास एक शक्तिशाली डेटा मॅनिप्युलेशन लायब्ररी म्हणून ओळखले आहे आणि डेटाफ्रेम कॉलम्स व्यवस्थापित करण्यासाठी काही संबंधित फंक्शन्सवर चर्चा केली आहे. या तंत्रांवर प्रभुत्व मिळवून, तुम्ही Python मधील डेटा प्रोसेसिंग कार्यांची विस्तृत श्रेणी हाताळण्यासाठी सुसज्ज असाल.