T-testin Suorittaminen Pythonilla
t-testin suorittaminen Pythonissa edellyttää vain vaihtoehtoisen hypoteesin määrittämistä sekä sen ilmoittamista, ovatko varianssit suunnilleen yhtä suuret (homogeeniset).
ttest_ind()
-kirjaston scipy.stats
-funktio hoitaa loput. Alla on syntaksi:
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Parametrit:
a
— ensimmäinen otos;b
— toinen otos;equal_var
— aseta arvoksiTrue
, jos varianssit ovat suunnilleen yhtä suuret, jaFalse
, jos eivät ole;alternative
— vaihtoehtoisen hypoteesin tyyppi:'two-sided'
— tarkoittaa, että keskiarvot eivät ole yhtä suuret;'less'
— tarkoittaa, että ensimmäinen keskiarvo on pienempi kuin toinen;'greater'
— tarkoittaa, että ensimmäinen keskiarvo on suurempi kuin toinen.
Paluuarvot:
statistic
— t-testisuureen arvo;pvalue
— p-arvo.
Huomio kohdistuu p-value
. Jos p-value
on pienempi kuin α (yleensä 0,05), t-testisuure osuu kriittiselle alueelle, jolloin vaihtoehtoinen hypoteesi hyväksytään. Jos p-value
on suurempi kuin α, nollahypoteesi hyväksytään, mikä osoittaa, että keskiarvot ovat yhtä suuret.
Alla on esimerkki t-testin soveltamisesta pituusaineistoon:
123456789101112131415import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Kysy minulta kysymyksiä tästä aiheesta
Tiivistä tämä luku
Näytä käytännön esimerkkejä
Awesome!
Completion rate improved to 2.63
T-testin Suorittaminen Pythonilla
Pyyhkäise näyttääksesi valikon
t-testin suorittaminen Pythonissa edellyttää vain vaihtoehtoisen hypoteesin määrittämistä sekä sen ilmoittamista, ovatko varianssit suunnilleen yhtä suuret (homogeeniset).
ttest_ind()
-kirjaston scipy.stats
-funktio hoitaa loput. Alla on syntaksi:
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Parametrit:
a
— ensimmäinen otos;b
— toinen otos;equal_var
— aseta arvoksiTrue
, jos varianssit ovat suunnilleen yhtä suuret, jaFalse
, jos eivät ole;alternative
— vaihtoehtoisen hypoteesin tyyppi:'two-sided'
— tarkoittaa, että keskiarvot eivät ole yhtä suuret;'less'
— tarkoittaa, että ensimmäinen keskiarvo on pienempi kuin toinen;'greater'
— tarkoittaa, että ensimmäinen keskiarvo on suurempi kuin toinen.
Paluuarvot:
statistic
— t-testisuureen arvo;pvalue
— p-arvo.
Huomio kohdistuu p-value
. Jos p-value
on pienempi kuin α (yleensä 0,05), t-testisuure osuu kriittiselle alueelle, jolloin vaihtoehtoinen hypoteesi hyväksytään. Jos p-value
on suurempi kuin α, nollahypoteesi hyväksytään, mikä osoittaa, että keskiarvot ovat yhtä suuret.
Alla on esimerkki t-testin soveltamisesta pituusaineistoon:
123456789101112131415import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Kiitos palautteestasi!