Kursinnhold
Lære Statistikk med Python
Lære Statistikk med Python
2. Gjennomsnitt, Median og Modus med Python
4. Kovarians vs. Korrelasjon
Avansert Beregning av Konfidensintervall med Python
Hvis du arbeider med en liten fordeling (størrelse ≤ 30) som tilnærmer seg normalfordelingen, bruk t-statistikk.
Hvordan beregne konfidensintervallet?
st.t.interval(0.95, len(data) - 1, loc=data.mean(), scale=st.sem(data))
- Funksjonen
t.interval()
frascipy.stats
brukes for Student's T-fordeling. 0.95
representerer konfidensnivået (også kjent somalpha
-parameteren).len(data) - 1
er frihetsgrader (df
), som er utvalgsstørrelsen minus én.loc
representerer gjennomsnittet av utvalgsdataene.sem
representerer standardfeilen til gjennomsnittet.
Frihetsgrader
Frihetsgrader refererer til antall uavhengige informasjonsenheter som brukes til å estimere en parameter.
Formelen for frihetsgrader er N - 1, hvor N er utvalgsstørrelsen.
Du kan endre alpha-parameteren for å observere hvordan den påvirker konfidensintervallet.
import scipy.stats as st import numpy as np data = [104, 106, 106, 107, 107, 107, 108, 108, 108, 108, 108, 109, 109, 109, 110, 110, 111, 111, 112] # Calculate the confidence interval confidence = st.t.interval(0.95, len(data)-1, loc = np.mean(data), scale = st.sem(data)) print(confidence)
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 5. Kapittel 6