सोडवले: गहाळ मूल्ये बदलण्यासाठी dict वापरा

डेटा हाताळणी आणि विश्लेषणाच्या जगात, गहाळ मूल्ये हाताळणे हे एक महत्त्वपूर्ण कार्य आहे. पांड्या, मोठ्या प्रमाणावर वापरलेली पायथन लायब्ररी, आम्हाला गहाळ डेटा कार्यक्षमतेने व्यवस्थापित करण्यास अनुमती देते. गहाळ मूल्ये हाताळण्यासाठी एक सामान्य दृष्टीकोन म्हणजे ही मूल्ये मॅप करण्यासाठी आणि पुनर्स्थित करण्यासाठी शब्दकोश वापरणे. या लेखात, आम्ही डेटासेटमधील हरवलेली मूल्ये बदलण्यासाठी शब्दकोष वापरण्यासाठी पांडा आणि पायथनच्या सामर्थ्याचा फायदा कसा घ्यावा याबद्दल चर्चा करू.

उपाय

आम्ही एक्सप्लोर करणार प्राथमिक उपाय वापरणे आहे भरणे() शब्दकोषांच्या संयोगाने कार्य. हा दृष्टीकोन आम्हाला गहाळ मूल्ये एका निर्दिष्ट शब्दकोशातील संबंधित मूल्यांसह पुनर्स्थित करण्यास सक्षम करेल.

कोडचे चरण-दर-चरण स्पष्टीकरण

ही प्रक्रिया स्पष्ट करण्यासाठी, समजू या की आमच्याकडे कपडे, रंग आणि ऐतिहासिक संदर्भांसह विविध फॅशन शैलींबद्दल माहिती असलेला डेटासेट आहे. काही प्रकरणांमध्ये, या डेटासेटमध्ये गहाळ मूल्ये असू शकतात.

प्रथम, आवश्यक लायब्ररी आयात करा आणि नमुना डेटाफ्रेम तयार करा:

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

आता आमच्याकडे समस्येचे वर्णन करणारा डेटाफ्रेम आहे, लक्षात घ्या की काही मूल्ये गहाळ आहेत (काहीही नाही द्वारे दर्शविले जाते). ही मूल्ये बदलण्यासाठी, योग्य मॅपिंग असलेले शब्दकोश तयार करा:

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

शेवटी, वापरा भरणे() एकत्रित शब्दकोश वापरून गहाळ मूल्ये पुनर्स्थित करण्यासाठी कार्य:

df_filled = df.fillna(replacement_dict)

पांडा लायब्ररी समजून घेणे

पांड्या Python मधील एक बहुमुखी लायब्ररी आहे जी डेटा हाताळणी आणि विश्लेषणासाठी डिझाइन केलेली आहे. हे लवचिक आणि शक्तिशाली डेटा संरचना जसे की मालिका आणि डेटाफ्रेम ऑफर करते. संरचित, सारणीबद्ध डेटासह कार्यक्षमतेने कार्य करण्यासाठी या संरचना आवश्यक आहेत.

पांडा फंक्शन्सचा समृद्ध संग्रह प्रदान करतात, जसे की भरणे(), गहाळ डेटा हाताळण्यासाठी वापरला जातो. इतर ऑपरेशन्स, जसे की डेटा विलीन करणे, डेटा पिव्होटिंग करणे आणि वेळ-मालिका विश्लेषण, पांडांसह अखंडपणे केले जाऊ शकते.

गहाळ डेटा हाताळण्यासाठी कार्ये

या व्यतिरिक्त भरणे() फंक्शन, पांडा गहाळ डेटा हाताळण्यासाठी इतर अनेक कार्ये आणि पद्धती ऑफर करतो, जसे की:

  • ड्रॉपना(): गहाळ डेटा असलेल्या पंक्ती किंवा स्तंभ काढा.
  • isna(): कोणते DataFrame किंवा Series घटक गहाळ किंवा शून्य आहेत ते ठरवा.
  • notna(): कोणते DataFrame किंवा Series घटक गहाळ किंवा शून्य नाहीत ते ठरवा.
  • इंटरपोलेट(): रेखीय इंटरपोलेशन वापरून गहाळ मूल्ये भरा.

या पद्धती, सोबत भरणे(), विविध संदर्भांमध्ये गहाळ डेटा हाताळण्यासाठी साधनांचा एक व्यापक संच प्रदान करा.

शेवटी, हा लेख कसा वापरायचा हे दाखवून दिले आहे dict पांडा डेटाफ्रेममधील हरवलेली मूल्ये बदलण्यासाठी. आम्ही नियोजित मुख्य कार्य, भरणे(), हे Pandas लायब्ररीतील एक शक्तिशाली साधन आहे जे आम्हाला गहाळ डेटा कार्यक्षमतेने हाताळण्याची परवानगी देते. शब्दकोषांचा फायदा घेऊन, आम्ही हरवलेली मूल्ये योग्य बदलांसाठी मॅप करू शकतो आणि आमचा डेटासेट पूर्ण आणि अर्थपूर्ण असल्याची खात्री करू शकतो. पांडस लायब्ररी आणि त्यात समाविष्ट केलेल्या कार्यांबद्दल सखोल समजून घेऊन, आम्ही मोठ्या डेटासेटसह प्रभावीपणे कार्य करू शकतो आणि आमच्या डेटामधून मौल्यवान अंतर्दृष्टी काढू शकतो.

संबंधित पोस्ट:

एक टिप्पणी द्या