Kursinnehåll
Lära Sig Statistik med Python
Lära Sig Statistik med Python
2. Medelvärde, Median och Typvärde med Python
4. Kovarians vs Korrelation
Avancerad Konfidensintervallberäkning med Python
Om du arbetar med en liten fördelning (storlek ≤ 30) som approximativt följer normalfördelningen, använd t-statistik.
Hur beräknas konfidensintervallet?
st.t.interval(0.95, len(data) - 1, loc=data.mean(), scale=st.sem(data))
- Funktionen
t.interval()
frånscipy.stats
används för Student's T-fördelning. 0.95
representerar konfidensnivån (även kalladalpha
-parametern).len(data) - 1
är frihetsgraderna (df
), vilket är stickprovsstorleken minus ett.loc
representerar medelvärdet av stickprovsdatan.sem
representerar standardfelet för medelvärdet.
Frihetsgrader
Frihetsgrader avser antalet oberoende informationsenheter som används för att uppskatta en parameter.
Formeln för frihetsgrader är N - 1, där N är stickprovsstorleken.
Du kan ändra alpha-parametern för att observera hur den påverkar konfidensintervallet.
import scipy.stats as st import numpy as np data = [104, 106, 106, 107, 107, 107, 108, 108, 108, 108, 108, 109, 109, 109, 110, 110, 111, 111, 112] # Calculate the confidence interval confidence = st.t.interval(0.95, len(data)-1, loc = np.mean(data), scale = st.sem(data)) print(confidence)
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 5. Kapitel 6