Lernen Konsistente Schätzung | Schätzung von Populationsparametern

In der Statistik ist eine konsistente Schätzung eine Schätzung, die mit zunehmender Stichprobengröße zum wahren Wert des Parameters konvergiert, was bedeutet, dass die Schätzung immer genauer wird, je mehr Daten gesammelt werden. Formal kann es wie folgt beschrieben werden:

Diese Definition mag ziemlich kompliziert erscheinen. Außerdem ist es in der Praxis nicht immer einfach, die Konsistenz einer Schätzung auf diese Weise zu überprüfen, weshalb wir ein einfacheres angewandtes Kriterium der Konsistenz einführen werden:

Daher, wenn unser Schätzer asymptotisch unverzerrt oder einfach unverzerrt ist und die Varianz des Schätzers abnimmt mit zunehmender Stichprobengröße, dann ist ein solcher Schätzer konsistent.

Zeigen wir, dass die Schätzungen des Stichprobenmittels und der angepassten Stichprobenvarianz konsistent sind.

Schätzung des Stichprobenmittels

Die Schätzung des Stichprobenmittels ist definitionsgemäß konsistent aufgrund des Gesetzes der großen Zahlen: Je mehr Terme wir zur Berechnung des Mittelwerts einbeziehen, desto näher tendiert der resultierende Wert an den mathematischen Erwartungswert.

Schätzung der angepassten Stichprobenvarianz

Um die Konsistenz der angepassten Stichprobenvarianz zu überprüfen, verwenden wir eine Simulation:


              1234567891011121314151617181920212223
            
import numpy as np
import matplotlib.pyplot as plt

# Generate 5000 samples from a normal distribution with mean 2 and standard deviation 2
samples = np.random.normal(2, 2, 5000)

# Function to calculate adjusted variance of subsamples
def adjusted_variance_value(data, subsample_size):
    return samples[:subsample_size].var(ddof=1)  # Calculate the adjusted variance using Bessel's correction

# Visualizing the results
x = np.arange(2, 5000)  # Generate values for the number of elements to calculate variance
y = np.zeros(4998)  # Initialize an array to store the calculated variances
for i in range(4998):  # Loop through the range of subsample sizes
    y[i] = adjusted_variance_value(samples, x[i])  # Calculate adjusted variance for each subsample size

# Plotting the results
plt.plot(x, y, label='Estimated adjusted variance')  # Plot estimated adjusted variance
plt.xlabel('Number of elements to calculate variance')  # Set x-axis label
plt.ylabel('Variance')  # Set y-axis label
plt.axhline(y=4, color='k', label='Real variance')  # Add a horizontal line representing the real variance
plt.legend()  # Add legend to the plot
plt.show()  # Display the result

Laut der Visualisierung können wir sehen, dass mit zunehmender Anzahl der Elemente die angepasste Stichprobenvarianz zu ihrem tatsächlichen Wert tendiert, sodass die Schätzung konsistent ist.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 6

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Swipe um das Menü anzuzeigen