সমাধান করা হয়েছে: পাইথনে অনুমানীয় পরিসংখ্যানের কোড

পাইথনে অনুমানীয় পরিসংখ্যানের জন্য কোড সম্পর্কিত প্রধান সমস্যা হল যে ফলাফলগুলি বোঝা এবং ব্যাখ্যা করা কঠিন হতে পারে। পাইথন একটি শক্তিশালী ভাষা, তবে অনুমানীয় পরিসংখ্যানের জন্য ব্যবহৃত কোড পড়া এবং বোঝা কঠিন হতে পারে। উপরন্তু, পাইথনে অনুমানিক পরিসংখ্যানের জন্য অনেকগুলি বিভিন্ন প্যাকেজ উপলব্ধ রয়েছে, যা একটি নির্দিষ্ট বিশ্লেষণের জন্য সঠিকটি বেছে নেওয়া কঠিন করে তুলতে পারে। অবশেষে, এই প্যাকেজগুলির মধ্যে কিছু অন্যদের মতো আপ-টু-ডেট বা নির্ভরযোগ্য নাও হতে পারে, তাই তাদের ব্যবহার করার আগে গবেষণা করা গুরুত্বপূর্ণ।

1. Chi-Square Test of Independence: 
from scipy.stats import chi2_contingency
chi2, p, dof, expected = chi2_contingency(observed)

2. One-Way ANOVA: 
from scipy import stats 
F, p = stats.f_oneway(sample1, sample2, sample3) 
  
3. Pearson’s Correlation Coefficient: 
from scipy.stats import pearsonr 
corr, _ = pearsonr(x, y)

লাইন 1: এই লাইনটি chi2_contingency ফাংশনটি scipy.stats লাইব্রেরি থেকে আমদানি করে এবং তারপরে পর্যবেক্ষণ করা ডেটাতে স্বাধীনতার একটি chi-স্কয়ার পরীক্ষা গণনা করতে ব্যবহার করে। এই পরীক্ষার ফলাফলগুলি chi2, p, dof এবং প্রত্যাশিত ভেরিয়েবলগুলিতে সংরক্ষণ করা হয়।

লাইন 2: এই লাইনটি স্কিপি লাইব্রেরি থেকে f_oneway ফাংশন আমদানি করে, এবং তারপর তিনটি নমুনায় (নমুনা1, নমুনা2, নমুনা3) একমুখী ANOVA গণনা করতে এটি ব্যবহার করে। এই পরীক্ষার ফলাফল F এবং p ভেরিয়েবলে সংরক্ষণ করা হয়।

লাইন 3: এই লাইনটি scipy.stats লাইব্রেরি থেকে পিয়ারসনর ফাংশন আমদানি করে এবং তারপর এটি দুটি ভেরিয়েবলের (x এবং y) মধ্যে পিয়ারসনের পারস্পরিক সম্পর্ক সহগ গণনা করতে ব্যবহার করে। এই পরীক্ষার ফলাফল ভেরিয়েবল corr এবং _ এ সংরক্ষণ করা হয়।

অনুমানমূলক পরিসংখ্যান কি

অনুমানীয় পরিসংখ্যান হল পরিসংখ্যানের একটি শাখা যা একটি জনসংখ্যা সম্পর্কে অনুমান বা সাধারণীকরণ করতে একটি নমুনা থেকে ডেটা ব্যবহার করে। এটি একটি নমুনা থেকে সংগৃহীত তথ্যের উপর ভিত্তি করে একটি জনসংখ্যা সম্পর্কে উপসংহার অঙ্কন জড়িত। পাইথনে, অনুমানমূলক পরিসংখ্যানগুলি বিভিন্ন কৌশল যেমন হাইপোথিসিস টেস্টিং, পারস্পরিক সম্পর্ক বিশ্লেষণ, রিগ্রেশন বিশ্লেষণ এবং আরও অনেক কিছু ব্যবহার করে উপসংহার টানতে এবং ভবিষ্যদ্বাণী করতে ব্যবহার করা যেতে পারে। এই কৌশলগুলি আমাদের ডেটা থেকে অর্থপূর্ণ অন্তর্দৃষ্টি আঁকতে এবং আরও ভাল সিদ্ধান্ত নিতে সাহায্য করে।

অনুমানমূলক পরিসংখ্যানের প্রকার

পাইথনে, বিভিন্ন ধরণের অনুমানমূলক পরিসংখ্যান রয়েছে যা ডেটা বিশ্লেষণ করতে ব্যবহার করা যেতে পারে। এর মধ্যে রয়েছে টি-টেস্ট, আনোভা, চি-স্কয়ার টেস্ট, পারস্পরিক সম্পর্ক পরীক্ষা এবং রিগ্রেশন বিশ্লেষণ। দুই বা ততোধিক গোষ্ঠীর ডেটার উপায় তুলনা করতে টি-টেস্ট ব্যবহার করা হয়। ANOVA ডেটার একাধিক গ্রুপের উপায় তুলনা করতে ব্যবহৃত হয়। শ্রেণীগত ভেরিয়েবলের মধ্যে সম্পর্ক পরীক্ষা করার জন্য চি-স্কোয়ার পরীক্ষা ব্যবহার করা হয়। পারস্পরিক সম্পর্ক পরীক্ষা দুটি ভেরিয়েবলের মধ্যে একটি রৈখিক সম্পর্কের শক্তি এবং দিক পরিমাপ করে। অবশেষে, রিগ্রেশন বিশ্লেষণ এক বা একাধিক স্বাধীন ভেরিয়েবল থেকে নির্ভরশীল ভেরিয়েবলের পূর্বাভাস দিতে ব্যবহৃত হয়।

আপনি কিভাবে অনুমানীয় পরিসংখ্যান লিখবেন?

অনুমানীয় পরিসংখ্যান হল পরিসংখ্যানের একটি শাখা যা একটি নমুনা থেকে ডেটা ব্যবহার করে যে জনসংখ্যা থেকে নমুনা নেওয়া হয়েছিল সে সম্পর্কে অনুমান করতে। পাইথনে, অনুমানমূলক পরিসংখ্যান বিভিন্ন লাইব্রেরি যেমন SciPy, StatsModels এবং NumPy ব্যবহার করে করা যেতে পারে।

পাইথনে অনুমানীয় পরিসংখ্যান সম্পাদন করতে, আপনাকে প্রথমে প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করতে হবে এবং তারপর ফাংশনগুলি ব্যবহার করতে হবে যেমন mean(), median(), mode(), variance(), Standard deviation(), t-test(), chi -square test() ইত্যাদি। উদাহরণস্বরূপ, আপনি যদি একটি প্রদত্ত ডেটাসেটের গড় গণনা করতে চান, আপনি NumPy থেকে mean() ফাংশন ব্যবহার করতে পারেন:

এনপি হিসাবে নাম্বার আমদানি করুন
ডেটা = [1,2,3,4]
গড়_মান = np.mean(ডেটা)
মুদ্রণ(মান_মান) # আউটপুট: 2.5

সম্পর্কিত পোস্ট:

মতামত দিন