हल किया गया: लापता मूल्यों को बदलने के लिए तानाशाही का उपयोग करें

डेटा हेरफेर और विश्लेषण की दुनिया में लापता मूल्यों को संभालना एक महत्वपूर्ण कार्य है। पांडा, एक व्यापक रूप से उपयोग की जाने वाली पायथन लाइब्रेरी, हमें लापता डेटा को कुशलतापूर्वक प्रबंधित करने की अनुमति देती है। लापता मूल्यों से निपटने के लिए एक सामान्य दृष्टिकोण में इन मूल्यों को मैप करने और बदलने के लिए शब्दकोशों का उपयोग करना शामिल है। इस लेख में, हम चर्चा करेंगे कि डेटासेट में लापता मानों को बदलने के लिए शब्दकोशों का उपयोग करने के लिए पंडों और पायथन की शक्ति का लाभ कैसे उठाया जाए।

उपाय

हम जिस प्राथमिक समाधान का पता लगाएंगे, वह उपयोग कर रहा है फिल्ना () शब्दकोशों के साथ मिलकर काम करता है। यह दृष्टिकोण हमें लापता मानों को निर्दिष्ट शब्दकोश से संबंधित मानों के साथ बदलने में सक्षम करेगा।

कोड की चरण-दर-चरण व्याख्या

इस प्रक्रिया को स्पष्ट करने के लिए, मान लें कि हमारे पास कपड़ों, रंगों और ऐतिहासिक संदर्भ सहित विभिन्न फैशन शैलियों के बारे में जानकारी वाला एक डेटासेट है। कुछ मामलों में, इस डेटासेट में गुम मान हो सकते हैं।

सबसे पहले, आवश्यक पुस्तकालयों को आयात करें और एक नमूना डेटाफ़्रेम बनाएँ:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

अब जब हमारे पास समस्या का वर्णन करने वाला डेटाफ़्रेम है, तो ध्यान दें कि कुछ मान गायब हैं (कोई नहीं द्वारा चिह्नित)। इन मानों को बदलने के लिए, उपयुक्त मैपिंग वाले शब्दकोश बनाएँ:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

अंत में, का उपयोग करें फिल्ना () संयुक्त शब्दकोश का उपयोग करके लापता मानों को बदलने के लिए कार्य करें:

df_filled = df.fillna(replacement_dict)

पंडों के पुस्तकालय को समझना

पांडा पायथन में एक बहुमुखी पुस्तकालय है जिसे डेटा हेरफेर और विश्लेषण के लिए डिज़ाइन किया गया है। यह श्रृंखला और डेटाफ़्रेम जैसी लचीली और शक्तिशाली डेटा संरचनाएँ प्रदान करता है। संरचित, सारणीबद्ध डेटा के साथ कुशलतापूर्वक काम करने के लिए ये संरचनाएं आवश्यक हैं।

पांडा कार्यों का एक समृद्ध संग्रह प्रदान करता है, जैसे फिल्ना (), लापता डेटा को संभालने के लिए उपयोग किया जाता है। अन्य ऑपरेशन, जैसे डेटा को मर्ज करना, डेटा को पिवट करना और समय-श्रृंखला विश्लेषण, पंडों के साथ मूल रूप से किया जा सकता है।

लापता डेटा को संभालने के लिए कार्य

करने के लिए इसके अलावा में फिल्ना () समारोह, पांडा लापता डेटा से निपटने के लिए कई अन्य कार्य और तरीके प्रदान करता है, जैसे:

  • ड्रॉपना (): अनुपलब्ध डेटा वाली पंक्तियाँ या कॉलम निकालें।
  • इस्ना (): निर्धारित करें कि कौन से डेटाफ़्रेम या श्रृंखला तत्व गायब हैं या अशक्त हैं।
  • नोटना (): निर्धारित करें कि कौन से डेटाफ़्रेम या श्रृंखला तत्व गायब या अशक्त नहीं हैं।
  • प्रक्षेप (): रैखिक इंटरपोलेशन का उपयोग करके लापता मान भरें।

इन विधियों के साथ फिल्ना (), विभिन्न संदर्भों में लापता डेटा को संभालने के लिए उपकरणों का व्यापक सूट प्रदान करें।

अंत में, इस लेख ने प्रदर्शित किया है कि कैसे उपयोग किया जाए dict पंडों के डेटाफ़्रेम में अनुपलब्ध मानों को बदलने के लिए। हमारे द्वारा नियोजित प्रमुख कार्य, फिल्ना ()पंडों के पुस्तकालय में एक शक्तिशाली उपकरण है जो हमें लापता डेटा को कुशलता से संभालने की अनुमति देता है। शब्दकोशों का लाभ उठाकर, हम गुम मूल्यों को उपयुक्त प्रतिस्थापनों में मैप कर सकते हैं और यह सुनिश्चित कर सकते हैं कि हमारा डेटासेट पूर्ण और सार्थक है। पंडों के पुस्तकालय और इसमें शामिल कार्यों की गहरी समझ के माध्यम से, हम बड़े डेटासेट के साथ प्रभावी ढंग से काम कर सकते हैं और अपने डेटा से मूल्यवान अंतर्दृष्टि प्राप्त कर सकते हैं।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो