Contenido del Curso
Aprendiendo Estadística con Python
Aprendiendo Estadística con Python
2. Media, Mediana y Moda con Python
4. Covarianza vs Correlación
Calcular la Varianza con Python
Cálculo de la varianza con NumPy
En numpy
, pasa la secuencia de valores (como una columna del conjunto de datos) a la función np.var()
, por ejemplo: np.var(df['work_year'])
.
Cálculo de la varianza con pandas
En pandas
, aplica el método .var()
directamente a la columna, así: df['work_year'].var()
.
Ambos métodos producen resultados similares, con ligeras diferencias debido al uso de diferentes denominadores: N en numpy
(varianza poblacional) y N-1 en pandas
(varianza muestral).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 3