सोडवले: पांडा नॉन-युनिक सामील होतात

डेटा मॅनिपुलेशन आणि अॅनालिसिसच्या क्षेत्रात पांडस ही मोठ्या प्रमाणावर वापरली जाणारी पायथन लायब्ररी आहे. हे संरचित डेटासह अखंडपणे कार्य करण्यासाठी आवश्यक डेटा संरचना आणि कार्ये प्रदान करते. ते ऑफर करत असलेल्या अनेक वैशिष्ट्यांपैकी एक म्हणजे नॉन-युनिक कीसह टेबलमध्ये सामील होण्याची क्षमता, जी व्यावहारिक अनुप्रयोगांमध्ये एक सामान्य आवश्यकता असू शकते. या लेखात, आम्ही या समस्येचे निराकरण करू, नॉन-युनिक कीसह पांडा डेटाफ्रेम ऑब्जेक्ट्समध्ये सामील होण्यासाठी वापरल्या जाणार्‍या कोडचे चरण-दर-चरण स्पष्टीकरण एक्सप्लोर करू आणि या प्रक्रियेत समाविष्ट असलेल्या लायब्ररी आणि कार्यांवर चर्चा करू.

परिचय

सारण्यांमध्ये सामील होणे हे डेटा हाताळणी आणि विश्लेषण कार्यांमध्ये केले जाणारे मूलभूत ऑपरेशन आहे. विशिष्ट परिस्थितींमध्ये, आम्हाला नॉन-युनिक की वर टेबल्समध्ये सामील होण्याची आवश्यकता असू शकते, जी आव्हाने सादर करू शकते. तथापि, शक्तिशाली Python लायब्ररी, pandas सह काम केल्याने, त्याची लवचिक कार्यक्षमता वापरून आम्हाला ही समस्या सुरेखपणे सोडवता येते.

नॉन-युनिक कीसह पांडा डेटाफ्रेममध्ये सामील होणे

पांडामध्ये डेटाफ्रेममध्ये सामील होण्यासाठी, आम्ही `मर्ज()` फंक्शन वापरू शकतो, जे अनन्य कीजवर सामील होण्यास समर्थन देते. तथापि, हे समजून घेणे आवश्यक आहे की नॉन-युनिक की जोडण्याचा परिणाम अपेक्षेपेक्षा वेगळा असू शकतो, कारण यामुळे कार्टेशियन उत्पादन होऊ शकते, परिणामी डेटाफ्रेममधील पंक्तींच्या संख्येत लक्षणीय वाढ होऊ शकते.

नॉन-युनिक कीसह डेटाफ्रेममध्ये सामील होण्यासाठी `मर्ज()` फंक्शन वापरण्यासाठी चरण-दर-चरण मार्गदर्शक येथे आहे:

import pandas as pd

# Create sample DataFrames
df1 = pd.DataFrame({"key": ["A", "B", "A", "C"], "value": [1, 2, 3, 4]})
df2 = pd.DataFrame({"key": ["A", "B", "A", "D"], "value2": [5, 6, 7, 8]})

# Perform the merge operation
result = df1.merge(df2, on="key", how="inner")

वरील उदाहरणात, आम्ही प्रथम पांडा लायब्ररी आयात करतो आणि दोन नमुना डेटाफ्रेम (df1 आणि df2) तयार करतो. त्यानंतर, आम्ही “की” स्तंभावरील डेटाफ्रेममध्ये सामील होण्यासाठी `मर्ज()` फंक्शन वापरतो, ज्यामध्ये अनन्य मूल्ये असतात (A आणि B पुनरावृत्ती होते). `कसे` पॅरामीटर "आतील" वर सेट केले आहे, कारण आम्हाला दोन्ही डेटाफ्रेममध्ये जुळणार्‍या की असलेल्या पंक्ती ठेवायच्या आहेत.

पांडा मर्ज फंक्शन समजून घेणे

पांडामधील `मर्ज()` फंक्शन हे टेबल जॉईन ऑपरेशन्स करण्यासाठी अतिशय शक्तिशाली आणि लवचिक साधन आहे. नॉन-युनिक कीसह डेटाफ्रेममध्ये सामील होण्याव्यतिरिक्त, ते सानुकूलनाच्या विविध स्तरांना समर्थन देते, ज्यामुळे तुम्हाला परिणामी डेटाफ्रेमवर पूर्ण नियंत्रण ठेवता येते.

`मर्ज()` फंक्शनमध्ये अनेक महत्त्वाचे पॅरामीटर्स आहेत जसे की:

  • बाकी आणि योग्य: हे विलीन करायचे डेटाफ्रेम आहेत.
  • on: डेटाफ्रेममध्ये सामील होण्यासाठी वापरले जाणारे स्तंभ. एकाधिक स्तंभांमध्ये सामील होताना हे एकल स्तंभ नाव किंवा स्तंभ नावांची सूची असू शकते.
  • कसे: ते कोणत्या प्रकारचे जॉईन करायचे ते परिभाषित करते. पर्यायांमध्ये 'डावीकडे', 'उजवीकडे', 'बाह्य' आणि 'आतील' समाविष्ट आहेत. डिफॉल्ट 'आतील' आहे.
  • प्रत्यय: हे आच्छादित स्तंभांना लागू करण्यासाठी स्ट्रिंग प्रत्ययांचा एक टपल आहे. डीफॉल्ट प्रत्यय डाव्या डेटाफ्रेमसाठी _x आणि उजव्या डेटाफ्रेमसाठी _y आहे.

विविध प्रकारचे जॉइन ऑपरेशन्स करण्यासाठी आणि आउटपुट सानुकूलित करण्यासाठी हे पॅरामीटर्स तुमच्या गरजेनुसार बदलले जाऊ शकतात.

पांडांमध्ये समान कार्ये

`मर्ज()` फंक्शन व्यतिरिक्त, पांडा डेटाफ्रेम्स वेगवेगळ्या प्रकारे एकत्र करण्यासाठी इतर फंक्शन्स देखील देतात, जसे की:

  • concat (): हे फंक्शन एका विशिष्ट अक्षावर डेटाफ्रेम जोडण्यासाठी वापरले जाते. तुम्ही अक्ष, जॉईन आणि की यांसारखे विविध पॅरामीटर्स निर्दिष्ट करून एकत्रीकरण नियंत्रित करू शकता.
  • सामील व्हा(): डेटाफ्रेम ऑब्जेक्ट्सवर जॉईन ऑपरेशन्स करण्यासाठी ही एक सोयीस्कर पद्धत आहे. हे मूलत: मर्ज() फंक्शनभोवती एक आवरण असते, ज्यामध्ये डाव्या डेटाफ्रेमला कॉलर डेटाफ्रेम असे गृहीत धरले जाते.

शेवटी, pandas `merge()` फंक्शन वापरून, तुम्ही डेटाफ्रेममध्ये नॉन-युनिक की सह सहजपणे सामील होऊ शकता. `मर्ज()` फंक्शनमध्ये उपलब्ध पॅरामीटर्सचा समृद्ध संच विविध डेटा मॅनिपुलेशन आवश्यकता पूर्ण करून, सामील होण्याच्या प्रक्रियेवर पूर्ण नियंत्रण प्रदान करतो. पांडा लायब्ररी हे डेटा विश्लेषकांसाठी एक अपरिहार्य साधन आहे आणि ते डेटाफ्रेम कार्यक्षमतेने एकत्रित आणि हाताळण्यासाठी इतर विविध कार्ये देते.

संबंधित पोस्ट:

एक टिप्पणी द्या