Contenu du cours
Apprendre les Statistiques avec Python
Apprendre les Statistiques avec Python
Réalisation d'un Test T dans Python
Pour réaliser un test t en Python, il suffit de spécifier l'hypothèse alternative et d'indiquer si les variances sont approximativement égales (homogènes).
La fonction ttest_ind()
du module scipy.stats
s'occupe du reste. Voici la syntaxe :
python
Paramètres :
a
— premier échantillon ;b
— second échantillon ;equal_var
— à définir surTrue
si les variances sont approximativement égales, et surFalse
si elles ne le sont pas ;alternative
— type d'hypothèse alternative :'two-sided'
— indique que les moyennes ne sont pas égales ;'less'
— implique que la première moyenne est inférieure à la seconde ;'greater'
— implique que la première moyenne est supérieure à la seconde.
Valeurs de retour :
statistic
— valeur de la statistique t ;pvalue
— la valeur p.
L'accent est mis sur la p-value
. Si la p-value
est inférieure à α (généralement 0,05), la statistique t se situe dans la région critique, ce qui conduit à l'acceptation de l'hypothèse alternative. Si la p-value
est supérieure à α, l'hypothèse nulle est acceptée, indiquant que les moyennes sont égales.
Voici un exemple d'application du test t à l'ensemble de données des tailles :
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Merci pour vos commentaires !