Kursinhalt
Statistik Lernen mit Python
Statistik Lernen mit Python
2. Mittelwert, Median und Modus mit Python
4. Kovarianz vs. Korrelation
Fortgeschrittene Berechnung von Konfidenzintervallen mit Python
Bei kleinen Stichprobenumfängen (Größe ≤ 30), die annähernd normalverteilt sind, sollten t-Statistiken verwendet werden.
Wie wird das Konfidenzintervall berechnet?
st.t.interval(0.95, len(data) - 1, loc=data.mean(), scale=st.sem(data))
- Die Funktion
t.interval()
ausscipy.stats
wird für die Student-T-Verteilung verwendet. 0.95
steht für das Konfidenzniveau (auch alsalpha
-Parameter bekannt).len(data) - 1
ist die Anzahl der Freiheitsgrade (df
), also Stichprobengröße minus eins.loc
steht für den Mittelwert der Stichprobendaten.sem
steht für den Standardfehler des Mittelwerts.
Freiheitsgrade
Freiheitsgrade bezeichnen die Anzahl unabhängiger Informationselemente, die zur Schätzung eines Parameters verwendet werden.
Die Formel für die Freiheitsgrade lautet N - 1, wobei N die Stichprobengröße ist.
Der Alpha-Parameter kann angepasst werden, um zu beobachten, wie sich das Konfidenzintervall verändert.
import scipy.stats as st import numpy as np data = [104, 106, 106, 107, 107, 107, 108, 108, 108, 108, 108, 109, 109, 109, 110, 110, 111, 111, 112] # Calculate the confidence interval confidence = st.t.interval(0.95, len(data)-1, loc = np.mean(data), scale = st.sem(data)) print(confidence)
War alles klar?
Danke für Ihr Feedback!
Abschnitt 5. Kapitel 6