Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Réalisation d'un Test T dans Python | Tests Statistiques
Apprendre les Statistiques avec Python
course content

Contenu du cours

Apprendre les Statistiques avec Python

Apprendre les Statistiques avec Python

1. Concepts de Base
2. Moyenne, Médiane et Mode avec Python
3. Variance et Écart Type
4. Covariance contre Corrélation
5. Intervalle de Confiance
6. Tests Statistiques

book
Réalisation d'un Test T dans Python

Pour réaliser un test t en Python, il suffit de spécifier l'hypothèse alternative et d'indiquer si les variances sont approximativement égales (homogènes).

La fonction ttest_ind() du module scipy.stats s'occupe du reste. Voici la syntaxe :

python

Paramètres :

  • a — premier échantillon ;

  • b — second échantillon ;

  • equal_var — à définir sur True si les variances sont approximativement égales, et sur False si elles ne le sont pas ;

  • alternative — type d'hypothèse alternative :

    • 'two-sided' — indique que les moyennes ne sont pas égales ;

    • 'less' — implique que la première moyenne est inférieure à la seconde ;

    • 'greater' — implique que la première moyenne est supérieure à la seconde.

Valeurs de retour :

  • statistic — valeur de la statistique t ;

  • pvalue — la valeur p.

L'accent est mis sur la p-value. Si la p-value est inférieure à α (généralement 0,05), la statistique t se situe dans la région critique, ce qui conduit à l'acceptation de l'hypothèse alternative. Si la p-value est supérieure à α, l'hypothèse nulle est acceptée, indiquant que les moyennes sont égales.

Voici un exemple d'application du test t à l'ensemble de données des tailles :

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 6. Chapitre 6

Demandez à l'IA

expand
ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

course content

Contenu du cours

Apprendre les Statistiques avec Python

Apprendre les Statistiques avec Python

1. Concepts de Base
2. Moyenne, Médiane et Mode avec Python
3. Variance et Écart Type
4. Covariance contre Corrélation
5. Intervalle de Confiance
6. Tests Statistiques

book
Réalisation d'un Test T dans Python

Pour réaliser un test t en Python, il suffit de spécifier l'hypothèse alternative et d'indiquer si les variances sont approximativement égales (homogènes).

La fonction ttest_ind() du module scipy.stats s'occupe du reste. Voici la syntaxe :

python

Paramètres :

  • a — premier échantillon ;

  • b — second échantillon ;

  • equal_var — à définir sur True si les variances sont approximativement égales, et sur False si elles ne le sont pas ;

  • alternative — type d'hypothèse alternative :

    • 'two-sided' — indique que les moyennes ne sont pas égales ;

    • 'less' — implique que la première moyenne est inférieure à la seconde ;

    • 'greater' — implique que la première moyenne est supérieure à la seconde.

Valeurs de retour :

  • statistic — valeur de la statistique t ;

  • pvalue — la valeur p.

L'accent est mis sur la p-value. Si la p-value est inférieure à α (généralement 0,05), la statistique t se situe dans la région critique, ce qui conduit à l'acceptation de l'hypothèse alternative. Si la p-value est supérieure à α, l'hypothèse nulle est acceptée, indiquant que les moyennes sont égales.

Voici un exemple d'application du test t à l'ensemble de données des tailles :

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 6. Chapitre 6
Nous sommes désolés de vous informer que quelque chose s'est mal passé. Qu'est-il arrivé ?
some-alt