हल किया गया: पांडा अद्वितीय मूल्य प्रत्येक स्तंभ

पांडा डेटा हेरफेर और विश्लेषण के लिए एक शक्तिशाली और व्यापक रूप से इस्तेमाल किया जाने वाला पायथन पुस्तकालय है। डेटासेट के साथ काम करते समय एक सामान्य कार्य प्रत्येक कॉलम में अद्वितीय मान खोजने की आवश्यकता है। यह आपके डेटा में मूल्यों की विविधता और वितरण को समझने के साथ-साथ संभावित आउटलेयर और त्रुटियों की पहचान करने में सहायक हो सकता है। इस लेख में, हम यह पता लगाएंगे कि पंडों का उपयोग करके इस कार्य को कैसे पूरा किया जाए और इसमें शामिल कोड की विस्तृत, चरण-दर-चरण व्याख्या प्रदान की जाए। हम कुछ संबंधित पुस्तकालयों और कार्यों पर भी चर्चा करेंगे जो अद्वितीय मूल्यों और अन्य डेटा विश्लेषण कार्यों के साथ काम करते समय उपयोगी हो सकते हैं।

पंडों का उपयोग करके प्रत्येक कॉलम में अद्वितीय मान खोजने की समस्या को हल करने के लिए, हमें पहले लाइब्रेरी को आयात करना होगा और अपने डेटासेट में पढ़ना होगा। एक बार हमारे पास अपना डेटाफ़्रेम हो जाने के बाद, हम प्रत्येक कॉलम के लिए अद्वितीय मान खोजने और प्रदर्शित करने के लिए `nunique ()` और `unique ()` फ़ंक्शंस का उपयोग कर सकते हैं।

import pandas as pd

# Read in the dataset
data = pd.read_csv('your_data_file.csv')

# Find and display the unique values for each column
for column in data.columns:
    unique_count = data[column].nunique()
    unique_values = data[column].unique()
    print(f"Column '{column}' has {unique_count} unique values:")
    print(unique_values)

ऊपर दिए गए कोड स्निपेट में, हम पहले पांडा लाइब्रेरी को आयात करते हैं और `pd.read_csv()` फ़ंक्शन का उपयोग करके अपने डेटासेट में पढ़ते हैं। अगला, हम लूप के लिए डेटाफ़्रेम में प्रत्येक कॉलम के माध्यम से पुनरावृति करते हैं। लूप के भीतर, हम वर्तमान कॉलम में अद्वितीय मानों की संख्या का पता लगाने के लिए `nunique ()` फ़ंक्शन का उपयोग करते हैं, और अद्वितीय मानों की सरणी को पुनः प्राप्त करने के लिए `unique ()` फ़ंक्शन का उपयोग करते हैं। अंत में, हम स्वरूपित स्ट्रिंग्स का उपयोग करके परिणाम प्रिंट करते हैं।

पांडा ननिक () और अद्वितीय () कार्य

पांडा नुनिक () एक उपयोगी कार्य है जो किसी दिए गए श्रृंखला या डेटाफ्रेम कॉलम में अद्वितीय मानों की संख्या देता है। किसी डेटासेट की समग्र जटिलता और विविधता को समझने का प्रयास करते समय यह सहायक हो सकता है। यह किसी भी लापता मान (जैसे "NaN") को ध्यान में रखता है और उन्हें डिफ़ॉल्ट रूप से बाहर कर देता है। यदि आप गिनती में लापता मानों को शामिल करना चाहते हैं, तो आप `ड्रॉपना` पैरामीटर को `गलत` पर सेट कर सकते हैं, जैसे: `नुनिक (ड्रॉपना = गलत)`।

पांडा अद्वितीय () एक अन्य मूल्यवान कार्य है जो निर्दिष्ट श्रृंखला या डेटाफ़्रेम कॉलम में अद्वितीय मानों की एक सरणी देता है। `नुनिक ()` के विपरीत, यह फ़ंक्शन वास्तव में स्वयं अद्वितीय मान लौटाता है, जिससे आप उन्हें और अधिक विश्लेषण, हेरफेर या आवश्यकतानुसार प्रदर्शित कर सकते हैं।

साथ में, ये फ़ंक्शन आपके डेटासेट में अद्वितीय मानों को खोजने और उनके साथ काम करने का एक शक्तिशाली और कुशल तरीका प्रदान करते हैं।

डेटा विश्लेषण के लिए संबंधित पुस्तकालय

ऊँचा होना संख्यात्मक कंप्यूटिंग के लिए एक लोकप्रिय पायथन लाइब्रेरी है जिसे अक्सर पंडों के संयोजन में उपयोग किया जाता है। यह एन-डायमेंशनल सरणियों और मैट्रिसेस के साथ काम करने के लिए गणितीय कार्यों और उपकरणों की एक विस्तृत श्रृंखला प्रदान करता है। बड़े डेटासेट और जटिल गणनाओं को संभालते समय, Numpy अपने प्रदर्शन संवर्द्धन और अनुकूलित डेटा संरचनाओं के लिए विशेष रूप से उपयोगी हो सकता है।

Scikit सीखने पायथन में मशीन सीखने के लिए एक शक्तिशाली पुस्तकालय है। यह डेटा प्रीप्रोसेसिंग, मॉडल चयन और मूल्यांकन के लिए उपकरणों के साथ-साथ वर्गीकरण, प्रतिगमन, क्लस्टरिंग और आयामीता में कमी के लिए विभिन्न प्रकार के एल्गोरिदम प्रदान करता है। यदि आप भविष्य कहनेवाला मॉडल बनाने या अन्य मशीन सीखने के कार्यों को करने के लिए अपने डेटासेट के अद्वितीय मूल्यों और अन्य विशेषताओं के साथ काम कर रहे हैं, तो स्किकिट-लर्न एक पुस्तकालय है जिसे आप आगे एक्सप्लोर करना चाहेंगे।

अंत में, डेटासेट के प्रत्येक कॉलम में अद्वितीय मान खोजना कई डेटा विश्लेषण और प्रीप्रोसेसिंग वर्कफ़्लोज़ में एक महत्वपूर्ण कदम है। पांडा इस कार्य में मदद करने के लिए कुशल और उपयोग में आसान `नूनिक ()` और `अद्वितीय ()` फ़ंक्शन प्रदान करते हैं, और उनके उपयोग को समझने से आपके डेटा विश्लेषण परियोजनाओं की गति और प्रभावशीलता में काफी सुधार हो सकता है। इसके अतिरिक्त, संबंधित पुस्तकालयों, जैसे कि नम्पी और स्किकिट-लर्न के बारे में अपने ज्ञान का विस्तार करना, डेटा हेरफेर और विश्लेषण में आपकी क्षमताओं को और बढ़ा सकता है, जिससे आप डेटा विज्ञान के बढ़ते क्षेत्र में सफलता के लिए तैयार हो सकते हैं।

संबंधित पोस्ट:

एक टिप्पणी छोड़ दो