Contenu du cours
Théorie Avancée des Probabilités
Théorie Avancée des Probabilités
Propriétés Utiles de la Distribution Gaussienne
La distribution gaussienne (également appelée distribution normale) est l'une des distributions les plus importantes en théorie des probabilités et en statistiques. Nous allons maintenant examiner certaines propriétés utiles de cette distribution et comprendre pourquoi elle est si importante et comment elle est appliquée dans la vie réelle.
Signification physique de la distribution gaussienne
La distribution gaussienne peut décrire une variable aléatoire résultant de l'addition de nombreux facteurs différents.
Par exemple, lors de la pesée de quelque chose, divers facteurs comme la température, la pression et les erreurs de mesure affectent le résultat. Individuellement, ces facteurs n'ont pas beaucoup d'importance, mais ensemble, ils ont un impact significatif. Cela est expliqué plus en détail dans le chapitre sur le Théorème Central Limite.
Voyons comment nous allons désigner les quantités gaussiennes à l'avenir :
Transformations linéaires de vecteurs gaussiens
La distribution gaussienne est préservée sous les transformations linéaires des variables aléatoires : si nous appliquons une transformation linéaire à une valeur gaussienne, nous obtiendrons également une valeur gaussienne en sortie, mais avec des caractéristiques différentes.
Les variables gaussiennes non corrélées sont indépendantes
Nous savons que la corrélation montre seulement la présence de dépendances linéaires entre les variables : en conséquence, les variables peuvent être dépendantes mais non corrélées. Mais dans le cas des variables gaussiennes, une corrélation nulle signifie que les variables sont indépendantes, ce qui est également une propriété très utile de la distribution gaussienne.
Règle des 3-sigmas
La règle des 3-sigmas, également connue sous le nom de règle empirique ou règle des 68-95-99,7, est une directive statistique qui stipule que pour une distribution normale :
- Environ
68%
des données se situent à une écart-type (σ
) de la moyenne (μ
); - Environ
95%
des données se situent à deux écarts-types (2σ
) de la moyenne (μ
); - Environ
99.7%
des données se situent à trois écarts-types (3σ
) de la moyenne (μ
). Cette règle peut être très utile pour détecter les valeurs aberrantes dans les données qui suivent une distribution gaussienne.
import numpy as np from scipy.stats import norm import matplotlib.pyplot as plt # Generate some data from a normal distribution mu = 0 # mean sigma = 1 # standard deviation x = np.linspace(mu - 4*sigma, mu + 4*sigma, 100) y = norm.pdf(x, mu, sigma) # Plot the PDF of the normal distribution plt.plot(x, y, label='PDF') # Shade the area within 1, 2, and 3 standard deviations of the mean plt.fill_between(x, 0, y, where=(x >= mu-sigma) & (x <= mu+sigma), alpha=0.3, label='68%') plt.fill_between(x, 0, y, where=(x >= mu-2*sigma) & (x <= mu+2*sigma), alpha=0.3, label='95%') plt.fill_between(x, 0, y, where=(x >= mu-3*sigma) & (x <= mu+3*sigma), alpha=0.3, label='99.7%') # Add a legend and labels plt.legend() plt.xlabel('X') plt.ylabel('PDF') plt.title('3-Sigma Rule for a Gaussian Distribution') # Show the plot plt.show()
Merci pour vos commentaires !