Implementering av Spridning i Python
Definiera datasetet
Här tilldelas en array till variabeln data för att säkerställa ett konsekvent dataset att använda vid alla beräkningar.
import numpy as np
# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
Beräkna populationsstatistik
Denna funktion tar arrayen som indata och returnerar medelvärdet av alla element, vilket sammanfattar den centrala tendensen i datasetet.
mean_val = np.mean(data) # Mean
variance_val = np.var(data) # Population variance (ddof=0 by default)
std_dev_val = np.std(data) # Population standard deviation
np.mean(data)beräknar det aritmetiska medelvärdet;np.var(data)beräknar populationsvariansen (dividerar med n);np.std(data)beräknar populationsstandardavvikelsen (kvadratroten av variansen).
123456789101112import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
Beräkna stickprovsstatistik
För att få oberoende skattningar från ett stickprov använder vi ddof=1.
Detta tillämpar Bessels korrigering, vilket innebär att variansen delas med $(n-1)$ istället för $n$.
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
np.var(data, ddof=1)- stickprovsvarians;np.std(data, ddof=1)- stickprovsstandardavvikelse.
12345678910import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
Standardavvikelsen är kvadratroten av variansen och ger ett spridningsmått i samma enheter som de ursprungliga data, vilket gör det lättare att tolka.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you explain the difference between population and sample statistics again?
Why do we use Bessel's correction (ddof=1) for sample statistics?
How do these statistics help in real business scenarios?
Fantastiskt!
Completion betyg förbättrat till 1.96
Implementering av Spridning i Python
Svep för att visa menyn
Definiera datasetet
Här tilldelas en array till variabeln data för att säkerställa ett konsekvent dataset att använda vid alla beräkningar.
import numpy as np
# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
Beräkna populationsstatistik
Denna funktion tar arrayen som indata och returnerar medelvärdet av alla element, vilket sammanfattar den centrala tendensen i datasetet.
mean_val = np.mean(data) # Mean
variance_val = np.var(data) # Population variance (ddof=0 by default)
std_dev_val = np.std(data) # Population standard deviation
np.mean(data)beräknar det aritmetiska medelvärdet;np.var(data)beräknar populationsvariansen (dividerar med n);np.std(data)beräknar populationsstandardavvikelsen (kvadratroten av variansen).
123456789101112import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
Beräkna stickprovsstatistik
För att få oberoende skattningar från ett stickprov använder vi ddof=1.
Detta tillämpar Bessels korrigering, vilket innebär att variansen delas med $(n-1)$ istället för $n$.
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
np.var(data, ddof=1)- stickprovsvarians;np.std(data, ddof=1)- stickprovsstandardavvikelse.
12345678910import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
Standardavvikelsen är kvadratroten av variansen och ger ett spridningsmått i samma enheter som de ursprungliga data, vilket gör det lättare att tolka.
Tack för dina kommentarer!