हल किया गया: पांडा गैर-अद्वितीय से जुड़ते हैं

पांडा डेटा हेरफेर और विश्लेषण के क्षेत्र में व्यापक रूप से इस्तेमाल किया जाने वाला पायथन पुस्तकालय है। यह संरचित डेटा के साथ निर्बाध रूप से काम करने के लिए आवश्यक डेटा संरचनाएं और कार्य प्रदान करता है। इसके द्वारा प्रदान की जाने वाली कई विशेषताओं में से एक गैर-अद्वितीय कुंजियों के साथ तालिकाओं में शामिल होने की क्षमता है, जो व्यावहारिक अनुप्रयोगों में एक सामान्य आवश्यकता हो सकती है। इस लेख में, हम इस समस्या के समाधान में डुबकी लगाएंगे, गैर-अद्वितीय कुंजियों के साथ पांडा डेटाफ़्रेम ऑब्जेक्ट्स में शामिल होने के लिए उपयोग किए गए कोड की चरण-दर-चरण व्याख्या का पता लगाएंगे और इस प्रक्रिया में शामिल पुस्तकालयों और कार्यों पर चर्चा करेंगे।

परिचय

तालिकाओं में शामिल होना डेटा हेरफेर और विश्लेषण कार्यों में किया जाने वाला एक मौलिक ऑपरेशन है। कुछ परिदृश्यों में, हमें गैर-अद्वितीय कुंजी पर तालिकाओं में शामिल होने की आवश्यकता हो सकती है, जो चुनौतियाँ पेश कर सकती हैं। हालाँकि, शक्तिशाली पायथन पुस्तकालय, पांडा के साथ काम करते हुए, हमें इसकी लचीली कार्यक्षमता का उपयोग करके इस समस्या को सुरुचिपूर्ण ढंग से हल करने की अनुमति देता है।

गैर-अद्वितीय कुंजियों के साथ पांडा डेटाफ़्रेम में शामिल होना

पांडा में DataFrames में शामिल होने के लिए, हम `मर्ज ()` फ़ंक्शन का उपयोग कर सकते हैं, जो गैर-अद्वितीय कुंजियों में शामिल होने का समर्थन करता है। हालांकि, यह समझना आवश्यक है कि गैर-अद्वितीय कुंजियों में शामिल होने का परिणाम अपेक्षा से भिन्न हो सकता है, क्योंकि इससे कार्टेशियन उत्पाद हो सकता है, जिसके परिणामस्वरूप डेटाफ़्रेम में पंक्तियों की संख्या में उल्लेखनीय वृद्धि हो सकती है।

यहाँ गैर-अद्वितीय कुंजियों के साथ DataFrames में शामिल होने के लिए `मर्ज ()` फ़ंक्शन का उपयोग करने के लिए चरण-दर-चरण मार्गदर्शिका दी गई है:

import pandas as pd

# Create sample DataFrames
df1 = pd.DataFrame({"key": ["A", "B", "A", "C"], "value": [1, 2, 3, 4]})
df2 = pd.DataFrame({"key": ["A", "B", "A", "D"], "value2": [5, 6, 7, 8]})

# Perform the merge operation
result = df1.merge(df2, on="key", how="inner")

उपरोक्त उदाहरण में, हम पहले पांडा पुस्तकालय आयात करते हैं और दो नमूना डेटाफ़्रेम (df1 और df2) बनाते हैं। फिर, हम "कुंजी" कॉलम पर डेटाफ़्रेम में शामिल होने के लिए `मर्ज ()` फ़ंक्शन का उपयोग करते हैं, जिसमें गैर-अद्वितीय मान होते हैं (ए और बी दोहराए जाते हैं)। `कैसे` पैरामीटर को "आंतरिक" पर सेट किया गया है, क्योंकि हम केवल उन पंक्तियों को रखना चाहते हैं जिनमें दोनों डेटाफ़्रेम में मिलान कुंजियाँ हैं।

पंडों के विलय समारोह को समझना

पांडा में `मर्ज ()` फ़ंक्शन टेबल जॉइन ऑपरेशंस करने के लिए एक बहुत ही शक्तिशाली और लचीला उपकरण है। गैर-अद्वितीय कुंजियों के साथ DataFrames में शामिल होने के अलावा, यह अनुकूलन के विभिन्न स्तरों का समर्थन करता है, जिससे आप परिणामी DataFrame पर पूर्ण नियंत्रण प्राप्त कर सकते हैं।

`मर्ज ()` फ़ंक्शन में कई महत्वपूर्ण पैरामीटर हैं जैसे:

  • बाएं और सही: ये मर्ज किए जाने वाले डेटाफ्रेम हैं।
  • on: वह कॉलम (स्तंभ) जिनका उपयोग डेटाफ्रेम में शामिल होने के लिए किया जाना चाहिए। एकाधिक कॉलम में शामिल होने पर यह एक कॉलम नाम या कॉलम नामों की सूची हो सकती है।
  • कैसे: यह प्रदर्शन किए जाने वाले शामिल होने के प्रकार को परिभाषित करता है। विकल्पों में 'बाएं', 'दाएं', 'बाहरी' और 'आंतरिक' शामिल हैं। डिफ़ॉल्ट 'आंतरिक' है।
  • प्रत्यय: यह ओवरलैपिंग कॉलम पर लागू करने के लिए स्ट्रिंग प्रत्यय का एक टपल है। डिफ़ॉल्ट प्रत्यय बाएं डेटाफ़्रेम के लिए _x और दाएं डेटाफ़्रेम के लिए _y है।

विभिन्न प्रकार के ज्वाइन ऑपरेशन करने और आउटपुट को कस्टमाइज़ करने के लिए इन मापदंडों को आपकी आवश्यकताओं के अनुसार ट्वीक किया जा सकता है।

पांडा में समान कार्य

`मर्ज ()` फ़ंक्शन के अलावा, पांडा डेटाफ़्रेम को अलग-अलग तरीकों से संयोजित करने के लिए अन्य फ़ंक्शन भी प्रदान करता है, जैसे:

  • कॉनकैट (): इस फ़ंक्शन का उपयोग किसी विशेष अक्ष के साथ डेटाफ़्रेम को जोड़ने के लिए किया जाता है। आप एक्सिस, जॉइन और कीज़ जैसे विभिन्न मापदंडों को निर्दिष्ट करके संघनन को नियंत्रित कर सकते हैं।
  • में शामिल होने के (): यह ज्वाइन ऑपरेशंस करने के लिए DataFrame ऑब्जेक्ट्स पर उपलब्ध एक सुविधाजनक तरीका है। यह अनिवार्य रूप से मर्ज () फ़ंक्शन के चारों ओर एक आवरण है, बाएं डेटाफ़्रेम को कॉलर डेटाफ़्रेम के रूप में माना जाता है।

अंत में, पांडा `मर्ज ()` फ़ंक्शन का उपयोग करके, आप आसानी से गैर-अद्वितीय कुंजियों के साथ डेटाफ़्रेम में शामिल हो सकते हैं। `मर्ज ()` फ़ंक्शन में उपलब्ध पैरामीटर का समृद्ध सेट शामिल होने की प्रक्रिया पर पूर्ण नियंत्रण प्रदान करता है, विभिन्न डेटा हेरफेर आवश्यकताओं को पूरा करता है। पांडा पुस्तकालय डेटा विश्लेषकों के लिए एक अनिवार्य उपकरण बना हुआ है और यह डेटाफ़्रेम को कुशलतापूर्वक संयोजित और हेरफेर करने के लिए कई अन्य कार्य प्रदान करता है।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो