Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Intervalles de Confiance pour les Paramètres de Population | Estimation des Paramètres de Population
Théorie Avancée des Probabilités
course content

Contenu du cours

Théorie Avancée des Probabilités

Théorie Avancée des Probabilités

1. Déclarations Supplémentaires de la Théorie des Probabilités
2. Les Théorèmes Limites de la Théorie des Probabilités
3. Estimation des Paramètres de Population
4. Test des Hypothèses Statistiques

book
Intervalles de Confiance pour les Paramètres de Population

Dans les chapitres précédents, nous avons examiné comment il est possible d'estimer les paramètres de la population et de vérifier la qualité des données des estimations. Mais ces estimations étaient ponctuelles : nous avons simplement déterminé la valeur possible du paramètre en fonction des données dont nous disposons. Mais il existe une autre approche : nous pouvons construire un certain intervalle qui, avec une certaine probabilité, couvre la valeur réelle du paramètre souhaité. Cet intervalle est appelé intervalle de confiance. Regardons la définition :

Le principe de construction des intervalles de confiance est quelque peu similaire au principe de construction des estimations ponctuelles. Nous utilisons également une certaine fonction avec nos échantillons comme arguments pour cette fonction. Nous utilisons la loi de distribution de cette fonction et construisons un intervalle. Mais une explication mathématique rigoureuse de ce processus peut être assez compliquée, donc nous ne nous y attarderons pas en détail.

Remarque

Il convient de noter qu'il existe un autre type d'estimation d'intervalle pour les paramètres de population appelé intervalle crédible, qui est construit en utilisant le théorème de Bayes. Ces intervalles ont des interprétations différentes :

  • L'intervalle de confiance est essentiellement un intervalle avec des bornes aléatoires qui, avec une certaine probabilité, couvre la vraie valeur constante du paramètre ;

  • En revanche, l'intervalle crédible est un intervalle constant où la valeur aléatoire du paramètre souhaité tombe avec une certaine probabilité.

Intervalle de confiance pour le paramètre d'espérance de la distribution gaussienne

Voyons comment construire un intervalle de confiance pour le paramètre d'espérance de la distribution gaussienne. Nous examinerons 2 situations différentes :

Dans l'image ci-dessus, nous avons fourni un intervalle de confiance pour l'espérance gaussienne si nous connaissons la variance. Nous utilisons la fonction de répartition inverse (PPF) de la distribution gaussienne et l'échantillon pour construire cet intervalle.

Ensuite, nous avons fourni un intervalle de confiance pour l'espérance gaussienne si nous ne connaissons pas la variance et avons utilisé la variance d'échantillon ajustée au lieu de la variance connue pour l'estimation. Nous utilisons la fonction de répartition inverse (PPF) de la distribution de Student avec un degré de liberté n-1 pour construire cet intervalle.

Intervalle de confiance avec Python

Regardons maintenant comment construire un intervalle de confiance pour la valeur moyenne des échantillons gaussiens en Python. Nous utiliserons différents niveaux de confiance et comparerons les intervalles construits en fonction des niveaux de confiance correspondants.

123456789101112131415161718192021222324252627
import numpy as np from scipy import stats import pandas as pd # Load the dataset samples = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/Advanced+Probability+course+media/gaussian_samples.csv', names=['Value']) data = np.array(samples) # Calculate the degrees of freedom n = len(data) df = n - 1 # Build confidence intervals with different confidence levels for conf_level in [0.9, 0.95, 0.99]: # Calculate the t-value for the given confidence level and degrees of freedom t_value = stats.t.ppf((1+ conf_level) / 2, df) # Calculate the sample mean and adjusted sample variance mean = np.mean(data) adjusted_var = np.var(data, ddof=1) # Calculate the lower and upper bounds of the confidence interval lower_bound = mean - t_value * np.sqrt(adjusted_var) / np.sqrt(n) upper_bound = mean + t_value * np.sqrt(adjusted_var) / np.sqrt(n) # Print the result print(f'{conf_level:.0%} confidence interval for mean value is: ({lower_bound:.2f}, {upper_bound:.2f})')
copy

Nous voyons que plus le niveau de confiance est élevé, plus l'intervalle que nous obtenons est large. Cela est assez logique, puisque plus l'intervalle est large, plus la probabilité que cet intervalle couvre la valeur réelle de la moyenne est élevée.

Quel est le niveau de confiance de l'intervalle de confiance ?

Quel est le niveau de confiance de l'intervalle de confiance ?

Sélectionnez la réponse correcte

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 8
We're sorry to hear that something went wrong. What happened?
some-alt