Kurssisisältö
Tilastotieteen Opiskelu Pythonilla
Tilastotieteen Opiskelu Pythonilla
2. Keskiarvo, Mediaani ja Moodi Pythonilla
4. Kovarianssi vs. Korrelaatio
T-test-Oletukset
t-testin perusajatus on, että se noudattaa t-jakaumaa. Jotta tämä pitää paikkansa, tehdään muutamia tärkeitä oletuksia:
-
Varianssien homogeenisuus. Verrattavien ryhmien varianssien tulisi olla suunnilleen samat;
-
Normaalijakautuneisuus. Molempien otosten tulisi noudattaa likimääräisesti normaalijakaumaa;
-
Riippumattomuus. Otosten tulee olla riippumattomia, eli toisen ryhmän arvot eivät saa vaikuttaa toisen ryhmän arvoihin.
On tärkeää huomata, että t-testi voi antaa virheellisiä tuloksia, jos nämä oletukset eivät täyty.
On olemassa erilaisia t-testejä, jotka huomioivat joidenkin oletusten rikkomisen:
- Jos varianssit ovat erilaiset, voidaan käyttää Welchin t-testiä. Sen perusajatus on sama. Ainoa ero on vapausasteiden laskennassa.
Welchin t-testin suorittaminen Pythonissa tavallisen t-testin sijaan onnistuu helposti asettamalla
equal_var=False
; - Jos otokset eivät ole riippumattomia (esimerkiksi jos halutaan verrata saman ryhmän keskiarvoja eri ajankohtina), voidaan käyttää parittaista t-testiä. Parittaisesta t-testistä keskustellaan myöhemmässä luvussa.
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 6. Luku 5