Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Covarianza | Covarianza vs Correlación
Aprendiendo Estadística con Python

bookCovarianza

Note
Definición

Covarianza es una medida de la variabilidad conjunta de dos variables aleatorias.

Las fórmulas para la muestra y la población de la covarianza difieren, pero no se discutirán en detalle aquí. Este capítulo se centra en calcular la covarianza para el siguiente conjunto de datos:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Cálculo de la covarianza con Python

Para calcular la covarianza en Python, utilice la función np.cov() de la biblioteca NumPy. Esta función recibe dos parámetros: las secuencias de datos para las que se desea calcular la covarianza.

El resultado se encuentra en el índice [0,1]. Este curso no abordará los otros valores del resultado, consulte el siguiente ejemplo:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Esto indica que los valores se mueven en la misma dirección. Esto es lógico, ya que un área de tienda más grande corresponde a una mayor cantidad de artículos. Una desventaja importante de la covarianza es que el valor puede ser infinito.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 1

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 2.63

bookCovarianza

Desliza para mostrar el menú

Note
Definición

Covarianza es una medida de la variabilidad conjunta de dos variables aleatorias.

Las fórmulas para la muestra y la población de la covarianza difieren, pero no se discutirán en detalle aquí. Este capítulo se centra en calcular la covarianza para el siguiente conjunto de datos:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Cálculo de la covarianza con Python

Para calcular la covarianza en Python, utilice la función np.cov() de la biblioteca NumPy. Esta función recibe dos parámetros: las secuencias de datos para las que se desea calcular la covarianza.

El resultado se encuentra en el índice [0,1]. Este curso no abordará los otros valores del resultado, consulte el siguiente ejemplo:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Esto indica que los valores se mueven en la misma dirección. Esto es lógico, ya que un área de tienda más grande corresponde a una mayor cantidad de artículos. Una desventaja importante de la covarianza es que el valor puede ser infinito.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 1
some-alt