Kursinhalt
Statistik Lernen mit Python
Statistik Lernen mit Python
2. Mittelwert, Median und Modus mit Python
4. Kovarianz vs. Korrelation
Varianz Mit Python Berechnen
Varianzberechnung mit NumPy
In numpy
wird die Sequenz von Werten (zum Beispiel eine Spalte aus dem Datensatz) an die Funktion np.var()
übergeben, zum Beispiel: np.var(df['work_year'])
.
Varianzberechnung mit pandas
In pandas
wird die Methode .var()
direkt auf die Spalte angewendet, wie folgt: df['work_year'].var()
.
Beide Methoden liefern ähnliche Ergebnisse, mit leichten Unterschieden aufgrund der Verwendung verschiedener Nenner: N in numpy
(Populationsvarianz) und N-1 in pandas
(Stichprobenvarianz).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
War alles klar?
Danke für Ihr Feedback!
Abschnitt 3. Kapitel 3