पायथन में माध्य, माध्यिका और मोड ढूँढना: डेटा का विश्लेषण करने पर एक व्यापक मार्गदर्शिका
डेटा विश्लेषण डेटासेट को समझने और व्याख्या करने का एक अनिवार्य हिस्सा है। डेटा विश्लेषण का एक मूलभूत पहलू डेटा के माध्य, माध्यिका और मोड की गणना करना है। ये तीन उपाय केंद्रीय प्रवृत्तियों का प्रतिनिधित्व करते हैं और डेटा में रुझानों और पैटर्न की पहचान करने में उपयोगी हैं। इस लेख में, हम माध्य, माध्यिका और मोड की अवधारणाओं का पता लगाएंगे और पायथन का उपयोग करके उनकी गणना कैसे करें। हम समान समस्याओं को हल करने में शामिल विभिन्न पुस्तकालयों और कार्यों पर भी चर्चा करेंगे।
**मीन** किसी डेटासेट का औसत मान है, जिसकी गणना डेटासेट में मानों की संख्या से मानों के योग को विभाजित करके की जाती है। **माध्यिका** किसी डेटासेट का मध्य मान है जब इसे आरोही या अवरोही क्रम में क्रमबद्ध किया जाता है। यदि डेटासेट में विषम संख्या में मान हैं, तो माध्यिका वह मान है जो बिल्कुल मध्य में स्थित है, जबकि सम संख्या में मानों के लिए, माध्यिका दो मध्य मानों का औसत है। **मोड** उस मान को संदर्भित करता है जो डेटासेट में सबसे अधिक बार होता है।
इन उपायों की गणना करने के लिए, हम एक पायथन प्रोग्राम लिखेंगे जो इनपुट के रूप में संख्याओं की एक सूची लेता है और माध्य, माध्य और मोड लौटाता है। आइए इस समाधान को लागू करने के लिए चरण-दर-चरण दृष्टिकोण का पालन करें।
# Step 1: Define a function to calculate the mean def calculate_mean(numbers): return sum(numbers) / len(numbers) # Step 2: Define a function to calculate the median def calculate_median(numbers): sorted_numbers = sorted(numbers) length = len(numbers) mid_index = length // 2 if length % 2 == 0: median = (sorted_numbers[mid_index - 1] + sorted_numbers[mid_index]) / 2 else: median = sorted_numbers[mid_index] return median # Step 3: Define a function to calculate the mode def calculate_mode(numbers): from collections import Counter count = Counter(numbers) mode = count.most_common(1)[0][0] return mode # Step 4: Implement the main function def main(): numbers = [int(x) for x in input("Enter numbers separated by spaces: ").split()] mean = calculate_mean(numbers) median = calculate_median(numbers) mode = calculate_mode(numbers) print("Mean:", mean) print("Median:", median) print("Mode:", mode) if __name__ == "__main__": main()
उपरोक्त कोड में चार चरण हैं। सबसे पहले, हम संख्याओं की सूची के माध्य की गणना करने के लिए एक फ़ंक्शन को परिभाषित करते हैं। दूसरे चरण में, हम माध्यिका की गणना के लिए एक अन्य फ़ंक्शन को परिभाषित करते हैं। यह फ़ंक्शन इनपुट सूची को सॉर्ट करता है और सूची की लंबाई के आधार पर मध्य मान ढूंढता है। तीसरे चरण में, हम संग्रह मॉड्यूल से काउंटर क्लास का उपयोग करके मोड की गणना करने के लिए एक फ़ंक्शन बनाते हैं। अंतिम चरण में मुख्य फ़ंक्शन को परिभाषित करना शामिल है, जो उपयोगकर्ता इनपुट लेता है, पहले से परिभाषित फ़ंक्शन को कॉल करता है, और इनपुट डेटा के माध्य, माध्य और मोड को आउटपुट करता है।
सांख्यिकी और डेटा विश्लेषण के लिए पायथन लाइब्रेरी
अजगर प्रदान करता है एकाधिक पुस्तकालय जो सांख्यिकीय विश्लेषण और डेटा हेरफेर में मदद करता है। कुछ लोकप्रिय पुस्तकालयों में शामिल हैं:
- ऊँचा होना - संख्यात्मक गणना, सरणियों के हेरफेर और रैखिक बीजगणित के लिए एक शक्तिशाली पुस्तकालय।
- पांडा - एक लचीली लाइब्रेरी जो डेटाफ़्रेम संरचनाओं का उपयोग करके डेटा हेरफेर और विश्लेषण क्षमताएं प्रदान करती है।
- SciPy - एक पुस्तकालय जो वैज्ञानिक कंप्यूटिंग से संबंधित है, जिसमें अनुकूलन, एकीकरण, प्रक्षेप और बहुत कुछ शामिल है।
माध्य, माध्यिका और मोड की गणना के लिए नम्पी और पांडा का उपयोग करना
बुनियादी पायथन कार्यान्वयन के अलावा, हम माध्य, माध्य और मोड की कुशलता से गणना करने के लिए नम्पी और पांडा पुस्तकालयों का उपयोग कर सकते हैं।
डेटासेट के लिए इन केंद्रीय प्रवृत्तियों की गणना करने के लिए नम्पी और पांडा का उपयोग कैसे करें इसका एक उदाहरण नीचे दिया गया है:
import numpy as np import pandas as pd data = [4, 2, 7, 3, 9, 1, 6, 5, 8] # Using Numpy mean_numpy = np.mean(data) median_numpy = np.median(data) # Using Pandas data_series = pd.Series(data) mode_pandas = data_series.mode().tolist() print("Mean (Numpy):", mean_numpy) print("Median (Numpy):", median_numpy) print("Mode (Pandas):", mode_pandas)
उपरोक्त उदाहरण में, हम क्रमशः माध्य और माध्यिका की गणना करने के लिए नम्पी फ़ंक्शन `मीन()` और `मेडियन()` का उपयोग करते हैं। मोड के लिए, हम अपने डेटा को पांडा श्रृंखला में परिवर्तित करते हैं और `मोड()` फ़ंक्शन का उपयोग करते हैं, जो मोड की एक सूची लौटाता है।
यह आलेख माध्य, माध्यिका और मोड की अवधारणाओं की व्यापक समझ प्रदान करता है और बुनियादी पायथन और लोकप्रिय पायथन पुस्तकालयों दोनों का उपयोग करके उनकी गणना कैसे करें। इन दृष्टिकोणों का उपयोग करके, डेटा विश्लेषक सार्थक निष्कर्ष निकालने और डेटा में रुझानों की पहचान करने के लिए डेटासेट का प्रभावी ढंग से विश्लेषण और व्याख्या कर सकते हैं।