Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Zentraler Grenzwertsatz | Die Grenzwertsätze der Wahrscheinlichkeitstheorie
Fortgeschrittene Wahrscheinlichkeitstheorie
course content

Kursinhalt

Fortgeschrittene Wahrscheinlichkeitstheorie

Fortgeschrittene Wahrscheinlichkeitstheorie

1. Zusätzliche Aussagen Aus Der Wahrscheinlichkeitstheorie
2. Die Grenzwertsätze der Wahrscheinlichkeitstheorie
3. Schätzung von Populationsparametern
4. Testing of Statistical Hypotheses

book
Zentraler Grenzwertsatz

Der zentrale Grenzwertsatz ist ein grundlegender statistischer Satz, der besagt, dass die Summe einer großen Anzahl unabhängiger, identisch verteilter Zufallsvariablen annähernd normalverteilt sein wird, unabhängig von der zugrunde liegenden Verteilung der einzelnen Zufallsvariablen.

Formulierung des Satzes

Die formale Beschreibung des Satzes kann wie folgt dargestellt werden:

Wie auch im Gesetz der großen Zahlen sehen wir, dass in der Definition des Zentralen Grenzwertsatzes ein Buchstabe 'd' über dem Pfeil steht. Dieser Buchstabe bedeutet die sogenannte Konvergenz in Verteilung. Einfach ausgedrückt kann es wie folgt interpretiert werden: Je mehr Terme wir haben, desto ähnlicher wird die PDF der Summe dieser Terme der PDF der Gaußschen Verteilung.
Anstelle der letzten Zeile in der obigen Formulierung wird oft eine andere verwendet:

In dieser Formulierung sprechen wir nicht mehr über Konvergenz. Stattdessen behaupten wir, dass die Summe sofort einem Gaußschen Verteilungsgesetz mit bestimmten Parametern folgt. Es ist jedoch wichtig zu beachten, dass diese Annäherung nur für große Werte von n gilt.

Für jede spezifische Verteilung unterscheidet sich der erforderliche Wert von n, aber im Allgemeinen, wenn n nicht kleiner als 35 ist, funktioniert diese Annäherung mit ziemlich hoher Genauigkeit.

Illustration des Satzes

Schauen Sie sich die folgende Illustration an: Wir berechnen die PDF der Summe von gleichverteilten Variablen. Wie in der Illustration gezeigt, wird die resultierende PDF umso ähnlicher einer Gaußschen PDF, je mehr Terme wir verwenden, um die Summe zu berechnen.

Schauen wir uns nun die PMF der Summe von Binomialvariablen an:

CLT-Implementierung

Wir werden 500 Stichproben erstellen, die jeweils Hunderte von Zufallsvariablen aus einer Exponentialverteilung enthalten.
Für jede dieser 500 Stichproben berechnen wir die Summe ihrer Zufallsvariablen und erstellen ein Histogramm aus den resultierenden 500 Werten. Dann vergleichen wir dieses Histogramm mit einem PDF-Diagramm einer Gaußschen Zufallsvariablen.

12345678910111213141516171819202122232425262728293031323334
import numpy as np import matplotlib.pyplot as plt # List to store the sum of samples from each iteration hist_samples = [] # Generate 500 samples and calculate the sum of random variables in each sample for i in range(500): generated_samples = np.random.poisson(4, 100) # Generate 100 random variables from a Poisson distribution with mean 4 hist_samples.append(generated_samples.sum()) # Calculate the sum and append it to hist_samples # Plot a histogram of the samples and pdf of Gaussian distribution fig, axes = plt.subplots(1,2) # Create subplots fig.set_size_inches(10, 5) # Set the size of the figure # Plot histogram on the first subplot axes[0].hist(hist_samples, bins=10, alpha=0.5, edgecolor='black', density=True) axes[0].set_title('Histogram of Sum of Poisson Values') # Set title for the first subplot # Parameters for Gaussian distribution mean = 400 # Mean of one Poisson variable is 4, mean of sum is 400 std = 20 # Variance of one Poisson variable is 4, variance of sum 400, std 20 # Define the range of x values for the plot x = np.linspace(mean - 3 * std, mean + 3 * std, 500) # Calculate the pdf of the Gaussian distribution pdf = (1 / (std * np.sqrt(2 * np.pi))) * np.exp(-((x - mean)**2) / (2 * std**2)) # Plot the pdf on the second subplot axes[1].plot(x, pdf) axes[1].set_title('Gaussian Distribution with Mean = {} and Variance = {}'.format(mean, std**2)) # Set title for the second subplot plt.show() # Display the plot
copy

Wir können beobachten, dass das resultierende Histogramm eng mit dem PDF der Gaußschen Verteilung übereinstimmt. Dies bestätigt die Gültigkeit des Theorems und zeigt seine Anwendbarkeit in realen Szenarien!

Was bedeutet der Buchstabe 'd' über dem Pfeil in der Definition des Zentralen Grenzwertsatzes?

Was bedeutet der Buchstabe 'd' über dem Pfeil in der Definition des Zentralen Grenzwertsatzes?

Wählen Sie die richtige Antwort aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 4
We're sorry to hear that something went wrong. What happened?
some-alt