La ĉefa problemo rilate al kodoj por inferenca statistiko en Python estas ke povas esti malfacile kompreni kaj interpreti la rezultojn. Python estas potenca lingvo, sed povas esti malfacile legi kaj kompreni la kodon uzatan por inferenca statistiko. Aldone, ekzistas multaj malsamaj pakaĵoj disponeblaj por inferencaj statistikoj en Python, kiuj povas malfaciligi elekti la ĝustan por aparta analizo. Fine, iuj el ĉi tiuj pakoj eble ne estas tiel ĝisdataj aŭ fidindaj kiel aliaj, do gravas esplori antaŭ ol uzi ilin.
1. Chi-Square Test of Independence: from scipy.stats import chi2_contingency chi2, p, dof, expected = chi2_contingency(observed) 2. One-Way ANOVA: from scipy import stats F, p = stats.f_oneway(sample1, sample2, sample3) 3. Pearson’s Correlation Coefficient: from scipy.stats import pearsonr corr, _ = pearsonr(x, y)
Linio 1: Ĉi tiu linio importas la chi2_contingency-funkcion el la biblioteko scipy.stats, kaj poste uzas ĝin por kalkuli ĉi-kvadratan provon de sendependeco sur la observitaj datumoj. La rezultoj de ĉi tiu testo estas konservitaj en variabloj chi2, p, dof kaj atendita.
Linio 2: Ĉi tiu linio importas la f_oneway-funkcion de la scipy-biblioteko, kaj tiam uzas ĝin por kalkuli unudirektan ANOVA sur tri specimenoj (specimeno1, specimeno2, specimeno3). La rezultoj de ĉi tiu testo estas konservitaj en variabloj F kaj p.
Linio 3: Ĉi tiu linio importas la pearsonr-funkcion el la biblioteko scipy.stats, kaj tiam uzas ĝin por kalkuli la korelacian koeficienton de Pearson inter du variabloj (x kaj y). La rezultoj de ĉi tiu testo estas konservitaj en variabloj korr kaj _.
Enhavo
Kio estas inferenca statistiko
Inferenca statistiko estas branĉo de statistiko, kiu uzas datumojn de specimeno por fari konkludojn aŭ ĝeneraligojn pri populacio. Ĝi implikas eltiri konkludojn pri populacio surbaze de la datumoj kolektitaj de specimeno. En Python, inferenca statistiko povas esti uzata por desegni konkludojn kaj fari prognozojn uzante diversajn teknikojn kiel hipoteztestado, korelacianalizo, regresa analizo kaj pli. Ĉi tiuj teknikoj permesas al ni eltiri signifajn komprenojn el niaj datumoj kaj helpi nin fari pli bonajn decidojn.
Tipoj de inferencaj statistikoj
En Python, ekzistas pluraj specoj de inferencaj statistikoj, kiuj povas esti uzataj por analizi datumojn. Ĉi tiuj inkluzivas t-testojn, ANOVA, ĥi-kvadratajn provojn, korelaciajn provojn kaj regresan analizon. T-testoj estas uzataj por kompari la rimedojn de du aŭ pli da grupoj de datumoj. ANOVA estas uzata por kompari la rimedojn de multoblaj grupoj de datenoj. Chi-kvadrataj testoj estas uzataj por testi pri rilatoj inter kategoriaj variabloj. Korelaciaj testoj mezuras la forton kaj direkton de linia rilato inter du variabloj. Finfine, regresa analizo estas uzata por antaŭdiri dependan variablon de unu aŭ pluraj sendependaj variabloj.
Kiel vi skribas inferencajn statistikojn
Inferenca statistiko estas branĉo de statistiko kiu uzas datumojn de provaĵo por fari konkludojn pri la populacio de kiu la provaĵo estis prenita. En Python, inferencaj statistikoj povas esti faritaj uzante diversajn bibliotekojn kiel SciPy, StatsModels kaj NumPy.
Por fari inferencajn statistikojn en Python, vi devos unue importi la necesajn bibliotekojn kaj poste uzi funkciojn kiel mean(), median(), mode(), variance(), norma devio(), t-test(), chi -square test() ktp. Ekzemple, se vi volus kalkuli la meznombre de donita datumaro, vi povus uzi la funkcion mean() de NumPy:
importi numpy kiel np
datumoj = [1,2,3,4]
mezvaloro = np.mean (datenoj)
print(mean_value) # Eligo: 2.5