Lære Avansert Beregning av Konfidensintervall med Python

Sveip for å vise menyen

Ved arbeid med en liten fordeling (størrelse ≤ 30) som tilnærmer seg normalfordelingen, brukes t-statistikk.

Hvordan beregne konfidensintervall?

st.t.interval(0.95, len(data) - 1, loc=data.mean(), scale=st.sem(data))

Funksjonen t.interval() fra scipy.stats brukes for Student's T-fordeling.
0.95 representerer signifikansnivået (også kjent som alpha-parameteren).
len(data) - 1 er frihetsgrader (df), som er utvalgsstørrelsen minus én.
loc representerer gjennomsnittet av utvalgsdataene.
sem representerer standardfeilen til gjennomsnittet.

Frihetsgrader

Frihetsgrader refererer til antall uavhengige informasjonsenheter som brukes til å estimere en parameter.

Formelen for frihetsgrader er N - 1, hvor N er utvalgsstørrelsen.

Du kan endre alpha-parameteren for å se hvordan den påvirker konfidensintervallet.


              1234567891011
            
import scipy.stats as st
import numpy as np

data = [104, 106, 106, 107, 107, 107, 108, 108, 108, 108, 108, 109, 109, 109, 110, 110, 111, 111, 112]
# Calculate the confidence interval
confidence = st.t.interval(0.95,
                           len(data)-1,
                           loc = np.mean(data),
                           scale = st.sem(data))

print(confidence)

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 6

Spør AI

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 5. Kapittel 6