Kursinhalt
Fortgeschrittene Wahrscheinlichkeitstheorie
Fortgeschrittene Wahrscheinlichkeitstheorie
Konsistente Schätzung
In der Statistik ist eine konsistente Schätzung eine Schätzung, die mit zunehmender Stichprobengröße zum wahren Wert des Parameters konvergiert, was bedeutet, dass die Schätzung immer genauer wird, je mehr Daten gesammelt werden. Formal kann es wie folgt beschrieben werden:
Diese Definition mag ziemlich kompliziert erscheinen. Außerdem ist es in der Praxis nicht immer einfach, die Konsistenz einer Schätzung auf diese Weise zu überprüfen, weshalb wir ein einfacheres angewandtes Kriterium der Konsistenz einführen werden:
Daher, wenn unser Schätzer asymptotisch unverzerrt oder einfach unverzerrt ist und die Varianz des Schätzers abnimmt mit zunehmender Stichprobengröße, dann ist ein solcher Schätzer konsistent.
Zeigen wir, dass die Schätzungen des Stichprobenmittels und der angepassten Stichprobenvarianz konsistent sind.
Schätzung des Stichprobenmittels
Die Schätzung des Stichprobenmittels ist definitionsgemäß konsistent aufgrund des Gesetzes der großen Zahlen: Je mehr Terme wir zur Berechnung des Mittelwerts einbeziehen, desto näher tendiert der resultierende Wert an den mathematischen Erwartungswert.
Schätzung der angepassten Stichprobenvarianz
Um die Konsistenz der angepassten Stichprobenvarianz zu überprüfen, verwenden wir eine Simulation:
import numpy as np import matplotlib.pyplot as plt # Generate 5000 samples from a normal distribution with mean 2 and standard deviation 2 samples = np.random.normal(2, 2, 5000) # Function to calculate adjusted variance of subsamples def adjusted_variance_value(data, subsample_size): return samples[:subsample_size].var(ddof=1) # Calculate the adjusted variance using Bessel's correction # Visualizing the results x = np.arange(2, 5000) # Generate values for the number of elements to calculate variance y = np.zeros(4998) # Initialize an array to store the calculated variances for i in range(4998): # Loop through the range of subsample sizes y[i] = adjusted_variance_value(samples, x[i]) # Calculate adjusted variance for each subsample size # Plotting the results plt.plot(x, y, label='Estimated adjusted variance') # Plot estimated adjusted variance plt.xlabel('Number of elements to calculate variance') # Set x-axis label plt.ylabel('Variance') # Set y-axis label plt.axhline(y=4, color='k', label='Real variance') # Add a horizontal line representing the real variance plt.legend() # Add legend to the plot plt.show() # Display the result
Laut der Visualisierung können wir sehen, dass mit zunehmender Anzahl der Elemente die angepasste Stichprobenvarianz zu ihrem tatsächlichen Wert tendiert, sodass die Schätzung konsistent ist.
Danke für Ihr Feedback!