Išspręsta: išvadinės statistikos kodai python

Pagrindinė problema, susijusi su išvadinės statistikos kodais Python, yra ta, kad gali būti sunku suprasti ir interpretuoti rezultatus. Python yra galinga kalba, tačiau gali būti sunku perskaityti ir suprasti kodą, naudojamą išvadinei statistikai. Be to, „Python“ yra daug skirtingų paketų, skirtų išvadinei statistikai, todėl gali būti sunku pasirinkti tinkamą konkrečiai analizei. Galiausiai, kai kurie iš šių paketų gali būti ne tokie naujausi ar patikimi kaip kiti, todėl prieš juos naudojant svarbu atlikti tyrimą.

1. Chi-Square Test of Independence: 
from scipy.stats import chi2_contingency
chi2, p, dof, expected = chi2_contingency(observed)

2. One-Way ANOVA: 
from scipy import stats 
F, p = stats.f_oneway(sample1, sample2, sample3) 
  
3. Pearson’s Correlation Coefficient: 
from scipy.stats import pearsonr 
corr, _ = pearsonr(x, y)

1 eilutė: ši eilutė importuoja funkciją chi2_contingency iš scipy.stats bibliotekos ir tada naudoja ją apskaičiuojant chi kvadrato nepriklausomumo nuo stebimų duomenų testą. Šio testo rezultatai saugomi kintamuosiuose chi2, p, dof ir laukiami.

2 eilutė: ši eilutė importuoja funkciją f_oneway iš scipy bibliotekos ir tada naudoja ją apskaičiuojant vienpusę ANOVA trimis pavyzdžiais (sample1, sample2, sample3). Šio testo rezultatai saugomi kintamuosiuose F ir p.

3 eilutė: ši eilutė importuoja funkciją pearsonr iš scipy.stats bibliotekos ir tada naudoja ją apskaičiuojant Pirsono koreliacijos koeficientą tarp dviejų kintamųjų (x ir y). Šio testo rezultatai saugomi kintamuosiuose corr ir _.

Kas yra išvadinė statistika

Išvadinė statistika yra statistikos šaka, kuri naudoja imties duomenis, kad padarytų išvadas ar apibendrinimus apie populiaciją. Tai apima išvadų apie populiaciją darymą remiantis imties duomenimis. Python programoje išvadinė statistika gali būti naudojama išvadoms ir prognozėms daryti naudojant įvairius metodus, tokius kaip hipotezių tikrinimas, koreliacinė analizė, regresinė analizė ir kt. Šie metodai leidžia mums gauti reikšmingų įžvalgų iš mūsų duomenų ir padėti priimti geresnius sprendimus.

Išvadinės statistikos rūšys

„Python“ yra kelių tipų išvadinė statistika, kurią galima naudoti duomenims analizuoti. Tai apima t testus, ANOVA, chi kvadrato testus, koreliacijos testus ir regresinę analizę. T testai naudojami dviejų ar daugiau duomenų grupių vidurkiams palyginti. ANOVA naudojama kelių duomenų grupių vidurkiams palyginti. Chi kvadrato testai naudojami kategorinių kintamųjų ryšiams patikrinti. Koreliacijos testai matuoja tiesinio ryšio tarp dviejų kintamųjų stiprumą ir kryptį. Galiausiai, regresinė analizė naudojama nuspėti priklausomą kintamąjį iš vieno ar kelių nepriklausomų kintamųjų.

Kaip rašyti išvadinę statistiką

Išvadinė statistika yra statistikos šaka, kuri naudoja imties duomenis, kad padarytų išvadas apie populiaciją, iš kurios buvo paimta imtis. „Python“ programoje išvadinė statistika gali būti atliekama naudojant įvairias bibliotekas, tokias kaip „SciPy“, „StatsModels“ ir „NumPy“.

Norėdami atlikti išvadinę statistiką Python, pirmiausia turėsite importuoti reikiamas bibliotekas ir tada naudoti tokias funkcijas kaip vidurkis(), median(), mode(), variance(), standartinis nuokrypis(), t-test(), chi -square test() ir tt Pavyzdžiui, jei norite apskaičiuoti tam tikro duomenų rinkinio vidurkį, galite naudoti funkciją mean() iš NumPy:

importuoti numpy kaip np
duomenys = [1,2,3,4]
vidutinė_vertė = np.vidurkis(duomenys)
print(mean_value) # Išvestis: 2.5

Susijusios naujienos:

Palikite komentarą