Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Effectuer un Test t en Python | Tests Statistiques
Apprendre les Statistiques avec Python
course content

Contenu du cours

Apprendre les Statistiques avec Python

Apprendre les Statistiques avec Python

1. Concepts de Base
2. Moyenne, Médiane et Mode avec Python
3. Variance et Écart-Type
4. Covariance vs Corrélation
5. Intervalle de Confiance
6. Tests Statistiques

book
Effectuer un Test t en Python

Pour effectuer un test t en Python, il vous suffit de spécifier l'hypothèse alternative et d'indiquer si les variances sont à peu près égales (homogènes).

La fonction ttest_ind() dans scipy.stats s'occupe du reste. Voici la syntaxe :

Paramètres :

  • a — le premier échantillon ;
  • b — le deuxième échantillon ;
  • equal_var — défini sur True si les variances sont à peu près égales, et False si elles ne le sont pas ;
  • alternative — le type d'hypothèse alternative :
    • 'two-sided' — indique que les moyennes ne sont pas égales ;
    • 'less' — implique que la première moyenne est inférieure à la seconde ;
    • 'greater' — implique que la première moyenne est supérieure à la seconde.

Valeurs de retour :

  • statistic — la valeur de la statistique t ;
  • pvalue — la valeur p.

Nous nous intéressons à la pvalue. Si elle est inférieure à α (généralement 0,05), alors la statistique t est dans la région critique, donc nous devrions accepter l'hypothèse alternative. Et si pvalue est supérieure à α — nous acceptons l'hypothèse nulle que les moyennes sont égales.

Voici un exemple d'application du test t à notre ensemble de données de hauteurs :

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 6. Chapitre 6
We're sorry to hear that something went wrong. What happened?
some-alt