Python ရှိ ကောက်နုတ်ကိန်းဂဏန်းစာရင်းဇယားများအတွက် ကုဒ်များနှင့် ပတ်သက်သည့် အဓိကပြဿနာမှာ ၎င်းသည် ရလဒ်များကို နားလည်ပြီး အဓိပ္ပာယ်ဖွင့်ဆိုရန် ခက်ခဲနိုင်သည်။ Python သည် အစွမ်းထက်သောဘာသာစကားတစ်ခုဖြစ်သော်လည်း ကောက်ကြောင်းကိန်းဂဏန်းစာရင်းဇယားများအတွက် အသုံးပြုသည့်ကုဒ်ကို ဖတ်ရှုနားလည်ရန် ခက်ခဲနိုင်သည်။ ထို့အပြင်၊ Python တွင် ကောက်ချက်ချသည့်စာရင်းအင်းများအတွက် ရရှိနိုင်သော မတူညီသော ပက်ကေ့ခ်ျများစွာရှိပါသည်၊ ၎င်းသည် သီးခြားခွဲခြမ်းစိတ်ဖြာမှုအတွက် မှန်ကန်သောတစ်ခုကို ရွေးချယ်ရန်ခက်ခဲစေပါသည်။ နောက်ဆုံးတွင်၊ ဤပက်ကေ့ဂျ်အချို့သည် အခြားသူများကဲ့သို့ ခေတ်ပေါ် သို့မဟုတ် စိတ်ချရမည်မဟုတ်သောကြောင့် ၎င်းတို့ကို အသုံးမပြုမီ သုတေသနပြုလုပ်ရန် အရေးကြီးပါသည်။
1. Chi-Square Test of Independence: from scipy.stats import chi2_contingency chi2, p, dof, expected = chi2_contingency(observed) 2. One-Way ANOVA: from scipy import stats F, p = stats.f_oneway(sample1, sample2, sample3) 3. Pearson’s Correlation Coefficient: from scipy.stats import pearsonr corr, _ = pearsonr(x, y)
လိုင်း 1- ဤလိုင်းသည် chi2_contingency လုပ်ဆောင်ချက်ကို scipy.stats စာကြည့်တိုက်မှ တင်သွင်းပြီး လေ့လာတွေ့ရှိထားသည့် ဒေတာအပေါ် လွတ်လပ်မှုရှိသော chi-square စမ်းသပ်မှုကို တွက်ချက်ရန် ၎င်းကို အသုံးပြုသည်။ ဤစမ်းသပ်မှု၏ရလဒ်များကို chi2၊ p၊ dof နှင့် မျှော်မှန်းထားသော variable များတွင် သိမ်းဆည်းထားသည်။
လိုင်း 2- ဤလိုင်းသည် f_oneway လုပ်ဆောင်ချက်ကို scipy စာကြည့်တိုက်မှ တင်သွင်းပြီး နမူနာသုံးခု (sample1၊ sample2၊ sample3) တွင် တစ်လမ်းသွား ANOVA ကို တွက်ချက်ရန် ၎င်းကိုအသုံးပြုသည်။ ဤစမ်းသပ်မှု၏ရလဒ်များကို ကိန်းရှင် F နှင့် p တွင် သိမ်းဆည်းထားသည်။
လိုင်း 3- ဤလိုင်းသည် pearsonr လုပ်ဆောင်ချက်ကို scipy.stats စာကြည့်တိုက်မှ တင်သွင်းပြီး ကိန်းရှင်နှစ်ခု (x နှင့် y) ကြားရှိ Pearson ၏ဆက်စပ်ကိန်းကို တွက်ချက်ရန် ၎င်းကိုအသုံးပြုသည်။ ဤစမ်းသပ်မှု၏ရလဒ်များကို variables corr နှင့် _ တွင်သိမ်းဆည်းထားသည်။
မာတိကာ
Inferential Statistics ဆိုတာ ဘာလဲ။
Inferential Statistics သည် လူဦးရေအကြောင်း ကောက်ချက်ချရန် သို့မဟုတ် ယေဘုယျဖော်ပြရန် နမူနာတစ်ခုမှ ဒေတာကို အသုံးပြုသည့် ကိန်းဂဏန်းစာရင်းဇယားတစ်ခုဖြစ်သည်။ ၎င်းတွင် နမူနာတစ်ခုမှ စုဆောင်းရရှိသည့် ဒေတာအပေါ်အခြေခံ၍ လူဦးရေနှင့်ပတ်သက်၍ ကောက်ချက်ဆွဲခြင်း ပါဝင်သည်။ Python တွင်၊ နိမိတ်ပုံစာရင်းအင်းများကို ကောက်ချက်ဆွဲရန်နှင့် ခန့်မှန်းချက်များကို ပြုလုပ်ရန် အမျိုးမျိုးသောနည်းပညာများဖြစ်သည့် သီအိုရီစမ်းသပ်ခြင်း၊ ဆက်စပ်မှုခွဲခြမ်းစိတ်ဖြာခြင်း၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာခြင်းနှင့် အခြားအရာများကဲ့သို့သော နည်းပညာများကို အသုံးပြု၍ ကောက်ချက်ချခြင်းနှင့် ခန့်မှန်းချက်များကို ပြုလုပ်နိုင်သည်။ ဤနည်းပညာများသည် ကျွန်ုပ်တို့၏ဒေတာများမှ အဓိပ္ပာယ်ရှိသော ထိုးထွင်းသိမြင်မှုများကို ထုတ်ယူနိုင်စေပြီး ပိုမိုကောင်းမွန်သော ဆုံးဖြတ်ချက်များချနိုင်ရန် ကူညီပေးပါသည်။
ကိန်းဂဏန်းစာရင်းဇယား အမျိုးအစားများ
Python တွင် ဒေတာခွဲခြမ်းစိတ်ဖြာရန် အသုံးပြုနိုင်သည့် ကိန်းဂဏန်းစာရင်းအင်း အမျိုးအစားများစွာရှိသည်။ ၎င်းတို့တွင် t-tests၊ ANOVA၊ chi-square စမ်းသပ်မှုများ၊ ဆက်စပ်စမ်းသပ်မှုများ၊ နှင့် regression analysis တို့ ပါဝင်သည်။ ဒေတာအုပ်စုနှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော အုပ်စုများ၏ နည်းလမ်းများကို နှိုင်းယှဉ်ရန် T-test ကို အသုံးပြုသည်။ ANOVA သည် ဒေတာအုပ်စုများစွာ၏ နည်းလမ်းများကို နှိုင်းယှဉ်ရန် အသုံးပြုသည်။ Chi-square စမ်းသပ်မှုများကို categorical variables များကြား ဆက်စပ်မှုများကို စမ်းသပ်ရန်အတွက် အသုံးပြုပါသည်။ Correlation tests များသည် variable နှစ်ခုကြားရှိ linear ဆက်နွယ်မှု၏ ခွန်အားနှင့် ဦးတည်ချက်ကို တိုင်းတာသည်။ နောက်ဆုံးတွင်၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာချက်ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော သီးခြားကိန်းရှင်များမှ မှီခိုသောကိန်းရှင်ကို ခန့်မှန်းရန် အသုံးပြုသည်။
ကောက်ချက်ချသော စာရင်းအင်းများကို သင်မည်ကဲ့သို့ ရေးသားသနည်း။
Inferential Statistics သည် နမူနာယူခဲ့သည့် လူဦးရေအကြောင်း ကောက်ချက်ချရန် နမူနာတစ်ခုမှ ဒေတာကို အသုံးပြုသည့် ကိန်းဂဏန်းစာရင်းဇယားတစ်ခုဖြစ်သည်။ Python တွင်၊ SciPy၊ StatsModels နှင့် NumPy ကဲ့သို့သော ဒစ်ဂျစ်တိုက်အမျိုးမျိုးကို အသုံးပြု၍ နိမိတ်ပုံစာရင်းအင်းများကို လုပ်ဆောင်နိုင်သည်။
Python တွင် ကောက်ချက်ချသည့်စာရင်းအင်းများလုပ်ဆောင်ရန်၊ လိုအပ်သောဒစ်ဂျစ်တိုက်များကို ဦးစွာတင်သွင်းပြီးနောက် mean(), median(), mode(), variance(), standard deviation(), t-test(), chi ကဲ့သို့သော လုပ်ဆောင်ချက်များကို အသုံးပြုရပါမည်။ -square test() စသည်တို့။ ဥပမာအားဖြင့်၊ သင်သည် ပေးထားသော dataset တစ်ခု၏ ဆိုလိုရင်းကို တွက်ချက်လိုပါက NumPy မှ mean() function ကို အသုံးပြုနိုင်သည်။
numpy ကို np အဖြစ်တင်သွင်းပါ
အချက်အလက် = [1,2,3,4]
mean_value = np.mean(ဒေတာ)
print(mean_value) # အထွက်- ၂.၅