Summary  
This chapter shows how to compute covariance between two numeric sequences in Python using NumPy’s np.cov() function, extract the covariance value, and printing the rounded result to assess the direction of their linear relationship.

General domain of usage  
Data analysis

**Covarianza** es una medida de la variabilidad conjunta de dos variables aleatorias.

Definición

Las fórmulas para la covarianza de **muestra** y **población** difieren, pero no se discutirán en detalle aquí. Este capítulo se centra en calcular la covarianza para el siguiente conjunto de datos:


- `Store_ID`: the unique id of the store;
- `Store_Area`: the area of the store;
- `Items_Available`: the number of items that are available in the store;
- `Daily_Customer_Count`: the daily number of customers in the store;
- `Store_Sales`: the number of sales in the store.

## Cálculo de la covarianza con Python

Para calcular la covarianza en Python, utiliza la función `np.cov()` de la biblioteca **NumPy**. Esta función recibe dos parámetros: las secuencias de datos para las que deseas calcular la covarianza.

El resultado se encuentra en el índice `[0,1]`. Este curso no cubrirá los otros valores del resultado, consulta el siguiente ejemplo:

import pandas as pd 
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv')

# Calculating covariance 
cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1]

print(round(cov, 2))

Esto indica que los valores se mueven en la misma dirección. Esto tiene sentido porque un área de tienda más grande corresponde a un mayor número de artículos. Una desventaja importante de la covarianza es que el valor puede ser infinito.

Construya una base sólida en estadística utilizando Python. Aprenda conceptos estadísticos esenciales y aplíquelos a través de NumPy y pandas. Avance desde medidas básicas como la media y la varianza hasta pruebas de hipótesis, intervalos de confianza y obtención de conclusiones basadas en datos con práctica práctica.

Descubre los principios estadísticos fundamentales, incluidos los tipos de datos, las medidas de tendencia central y las diferencias clave entre muestras y poblaciones.

Aprende a calcular e interpretar la media, la mediana y la moda utilizando Python. Practica estas operaciones con pandas para analizar conjuntos de datos reales.

Comprender cómo la varianza y la desviación estándar miden la dispersión de los datos. Aprender a calcular ambas manualmente y utilizando herramientas de Python.

Explora cómo la covarianza y la correlación describen las relaciones entre variables. Practica el cálculo y la comparación de ambas métricas en Python.

Domina los intervalos de confianza para estimar parámetros poblacionales. Utiliza NumPy, pandas y bibliotecas de visualización para calcular e interpretar intervalos con datos reales.

Aprende los fundamentos de las pruebas de hipótesis y la prueba t. Comprende cómo diseñar, realizar e interpretar pruebas utilizando Python para respaldar decisiones basadas en datos.