Contenu du cours
Théorie Avancée des Probabilités
Théorie Avancée des Probabilités
Défi : Utiliser le TCL pour Comparer les Valeurs Moyennes des Ensembles de Données Non Gaussiens
Dans le dernier chapitre, nous avons examiné comment comparer les espérances mathématiques de deux ensembles de données gaussiens. Mais que faire si les ensembles de données ne sont pas gaussiens, et est-il possible de les comparer dans ce cas ?
Utilisation du Théorème Central Limite pour comparer les valeurs moyennes
Nous pouvons utiliser le TCL pour comparer les valeurs moyennes des ensembles de données non gaussiens :
- Si nous avons de nombreux échantillons, nous pouvons utiliser le TCL pour construire de nouvelles caractéristiques : au lieu d'analyser les échantillons, nous pouvons analyser les valeurs moyennes des échantillons. Grâce au TCL, si nous calculons la moyenne avec de nombreux échantillons, cette valeur moyenne sera normalement distribuée ;
- Utilisez le critère de Student décrit dans le chapitre précédent pour tester l'hypothèse.
Remarque
Pour différentes distributions, vous devez sélectionner un nombre différent d'échantillons pour lequel la moyenne est calculée afin d'atteindre la normalité. Cela se fait généralement de manière expérimentale en utilisant divers tests de normalité, par exemple, le test de normalité
shapiro
.
Swipe to start coding
Nous allons maintenant vérifier l'hypothèse selon laquelle deux ensembles de données exponentielles ont des valeurs moyennes égales en utilisant le Théorème Central Limite. Votre tâche est :
- Importez la fonction
ttest_ind
du modulescipy.stats
pour effectuer le test t. - Utilisez la méthode
.mean()
pour calculer la moyenne sur la fenêtre glissante dans la fonctionsliding_mean
. - Utilisez la fonction
shapiro()
pour vérifier la normalité du tableauX_mean
. - Spécifiez la condition dans l'instruction
if
pour vérifier l'hypothèse.
Solution
Merci pour vos commentaires !
Défi : Utiliser le TCL pour Comparer les Valeurs Moyennes des Ensembles de Données Non Gaussiens
Dans le dernier chapitre, nous avons examiné comment comparer les espérances mathématiques de deux ensembles de données gaussiens. Mais que faire si les ensembles de données ne sont pas gaussiens, et est-il possible de les comparer dans ce cas ?
Utilisation du Théorème Central Limite pour comparer les valeurs moyennes
Nous pouvons utiliser le TCL pour comparer les valeurs moyennes des ensembles de données non gaussiens :
- Si nous avons de nombreux échantillons, nous pouvons utiliser le TCL pour construire de nouvelles caractéristiques : au lieu d'analyser les échantillons, nous pouvons analyser les valeurs moyennes des échantillons. Grâce au TCL, si nous calculons la moyenne avec de nombreux échantillons, cette valeur moyenne sera normalement distribuée ;
- Utilisez le critère de Student décrit dans le chapitre précédent pour tester l'hypothèse.
Remarque
Pour différentes distributions, vous devez sélectionner un nombre différent d'échantillons pour lequel la moyenne est calculée afin d'atteindre la normalité. Cela se fait généralement de manière expérimentale en utilisant divers tests de normalité, par exemple, le test de normalité
shapiro
.
Swipe to start coding
Nous allons maintenant vérifier l'hypothèse selon laquelle deux ensembles de données exponentielles ont des valeurs moyennes égales en utilisant le Théorème Central Limite. Votre tâche est :
- Importez la fonction
ttest_ind
du modulescipy.stats
pour effectuer le test t. - Utilisez la méthode
.mean()
pour calculer la moyenne sur la fenêtre glissante dans la fonctionsliding_mean
. - Utilisez la fonction
shapiro()
pour vérifier la normalité du tableauX_mean
. - Spécifiez la condition dans l'instruction
if
pour vérifier l'hypothèse.
Solution
Merci pour vos commentaires !