Kursinhalt
Fortgeschrittene Wahrscheinlichkeitstheorie
Fortgeschrittene Wahrscheinlichkeitstheorie
Nützliche Eigenschaften der Gaußschen Verteilung
Die Gaußsche Verteilung (auch Normalverteilung genannt) ist eine der wichtigsten Verteilungen in der Wahrscheinlichkeitstheorie und Statistik. Nun werden wir einige nützliche Eigenschaften dieser Verteilung betrachten und verstehen, warum sie so wichtig ist und wie sie im realen Leben angewendet wird.
Physikalische Bedeutung der Gaußschen Verteilung
Die Gaußsche Verteilung kann eine Zufallsvariable beschreiben, die sich aus vielen verschiedenen Faktoren zusammensetzt.
Zum Beispiel, wenn man etwas wiegt, beeinflussen verschiedene Faktoren wie Temperatur, Druck und Messfehler das Ergebnis. Einzelne Faktoren sind nicht so wichtig, aber zusammen haben sie einen erheblichen Einfluss. Dies wird im Kapitel über den zentralen Grenzwertsatz weiter erklärt.
Schauen wir uns an, wie wir die Gaußschen Größen in Zukunft bezeichnen werden:
Lineare Transformationen von Gaußschen Vektoren
Die Gaußsche Verteilung bleibt unter linearen Transformationen von Zufallsvariablen erhalten: Wenn wir eine lineare Transformation auf einen Gaußschen Wert anwenden, erhalten wir auch einen Gaußschen Wert am Ausgang, jedoch mit anderen Eigenschaften.
Unkorrelierte Gaußsche Variablen sind unabhängig
Wir wissen, dass die Korrelation nur das Vorhandensein linearer Abhängigkeiten zwischen Variablen zeigt: Infolgedessen können Variablen abhängig, aber nicht korreliert sein. Im Fall von Gaußschen Variablen bedeutet jedoch eine Nullkorrelation, dass die Variablen unabhängig sind, was ebenfalls eine sehr nützliche Eigenschaft der Gaußschen Verteilung ist.
3-Sigma-Regel
Die 3-Sigma-Regel, auch bekannt als empirische Regel oder 68-95-99,7-Regel, ist eine statistische Richtlinie, die besagt, dass für eine Normalverteilung:
- Ungefähr
68%
der Daten innerhalb einer Standardabweichung (σ
) vom Mittelwert (μ
) liegen; - Ungefähr
95%
der Daten innerhalb von zwei Standardabweichungen (2σ
) vom Mittelwert (μ
) liegen; - Ungefähr
99.7%
der Daten innerhalb von drei Standardabweichungen (3σ
) vom Mittelwert (μ
) liegen. Diese Regel kann sehr nützlich sein, um Ausreißer in Daten zu erkennen, die eine Gaußsche Verteilung haben.
import numpy as np from scipy.stats import norm import matplotlib.pyplot as plt # Generate some data from a normal distribution mu = 0 # mean sigma = 1 # standard deviation x = np.linspace(mu - 4*sigma, mu + 4*sigma, 100) y = norm.pdf(x, mu, sigma) # Plot the PDF of the normal distribution plt.plot(x, y, label='PDF') # Shade the area within 1, 2, and 3 standard deviations of the mean plt.fill_between(x, 0, y, where=(x >= mu-sigma) & (x <= mu+sigma), alpha=0.3, label='68%') plt.fill_between(x, 0, y, where=(x >= mu-2*sigma) & (x <= mu+2*sigma), alpha=0.3, label='95%') plt.fill_between(x, 0, y, where=(x >= mu-3*sigma) & (x <= mu+3*sigma), alpha=0.3, label='99.7%') # Add a legend and labels plt.legend() plt.xlabel('X') plt.ylabel('PDF') plt.title('3-Sigma Rule for a Gaussian Distribution') # Show the plot plt.show()
Danke für Ihr Feedback!