Lære Implementering af Spredning i Python

Definer datasættet

Her tildeles et array til variablen data for at sikre, at vi har et konsistent datasæt at arbejde med til alle beregninger.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Beregn populationsstatistik

Denne funktion tager arrayet som input og returnerer gennemsnitsværdien af alle elementer, hvilket opsummerer datasættets centrale tendens.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

np.mean(data) beregner det aritmetiske gennemsnit;
np.var(data) beregner populationsvariansen (dividerer med $n$ );
np.std(data) beregner populationsstandardafvigelsen (kvadratroden af variansen).


              123456789101112
            
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

print(f"Mean: {mean_val}")
print(f"Variance (Population): {variance_val}")
print(f"Standard Deviation (Population): {std_dev_val}")

Beregn stikprøvestatistik

For at opnå upartiske estimater fra en stikprøve anvendes ddof=1. Dette anvender Bessels korrektion, hvor variansen divideres med $(n-1)$ i stedet for $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

np.var(data, ddof=1) - stikprøvevarians;
np.std(data, ddof=1) - stikprøvestandardafvigelse.


              12345678910
            
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

print(f"Variance (Sample): {sample_variance_val}")
print(f"Standard Deviation (Sample): {sample_std_dev_val}")

Bemærk

Standardafvigelse er kvadratroden af variansen og giver et mål for spredning i samme enheder som de oprindelige data, hvilket gør det lettere at fortolke.

Var alt klart?

Tak for dine kommentarer!

Sektion 5. Kapitel 8

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the difference between population and sample statistics again?

Why do we use Bessel's correction (ddof=1) for sample statistics?

How do these statistics help in real business scenarios?

Awesome!

Completion rate improved to 1.96

Stryg for at vise menuen