Lära Implementering av Spridning i Python

Definiera datasetet

Här tilldelas en array till variabeln data för att säkerställa ett konsekvent dataset att använda vid alla beräkningar.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Beräkna populationsstatistik

Denna funktion tar arrayen som indata och returnerar medelvärdet av alla element, vilket sammanfattar den centrala tendensen i datasetet.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

np.mean(data) beräknar det aritmetiska medelvärdet;
np.var(data) beräknar populationsvariansen (dividerar med $n$ );
np.std(data) beräknar populationsstandardavvikelsen (kvadratroten av variansen).


              123456789101112
            
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

print(f"Mean: {mean_val}")
print(f"Variance (Population): {variance_val}")
print(f"Standard Deviation (Population): {std_dev_val}")

Beräkna stickprovsstatistik

För att få oberoende skattningar från ett stickprov använder vi ddof=1. Detta tillämpar Bessels korrigering, vilket innebär att variansen delas med $(n-1)$ istället för $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

np.var(data, ddof=1) - stickprovsvarians;
np.std(data, ddof=1) - stickprovsstandardavvikelse.


              12345678910
            
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

print(f"Variance (Sample): {sample_variance_val}")
print(f"Standard Deviation (Sample): {sample_std_dev_val}")

Not

Standardavvikelsen är kvadratroten av variansen och ger ett spridningsmått i samma enheter som de ursprungliga data, vilket gör det lättare att tolka.

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 8

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Svep för att visa menyn