Covarianza
Covarianza è una misura della variabilità congiunta di due variabili casuali.
Le formule per la covarianza campionaria e popolazione differiscono, ma non saranno discusse in dettaglio qui. Questo capitolo si concentra sul calcolo della covarianza per il seguente dataset:
Store_ID: the unique id of the store;Store_Area: the area of the store;Items_Available: the number of items that are available in the store;Daily_Customer_Count: the daily number of customers in the store;Store_Sales: the number of sales in the store.
Calcolo della covarianza con Python
Per calcolare la covarianza in Python, utilizzare la funzione np.cov() della libreria NumPy. Questa funzione accetta due parametri: le sequenze di dati per cui si desidera calcolare la covarianza.
Il risultato si trova all'indice [0,1]. Questo corso non tratterà gli altri valori dell'output, fare riferimento all'esempio:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Questo indica che i valori si muovono nella stessa direzione. Questo è logico perché una superficie del negozio più ampia corrisponde a un numero maggiore di articoli. Un limite significativo della covarianza è che il valore può essere infinito.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Fantastico!
Completion tasso migliorato a 2.63
Covarianza
Scorri per mostrare il menu
Covarianza è una misura della variabilità congiunta di due variabili casuali.
Le formule per la covarianza campionaria e popolazione differiscono, ma non saranno discusse in dettaglio qui. Questo capitolo si concentra sul calcolo della covarianza per il seguente dataset:
Store_ID: the unique id of the store;Store_Area: the area of the store;Items_Available: the number of items that are available in the store;Daily_Customer_Count: the daily number of customers in the store;Store_Sales: the number of sales in the store.
Calcolo della covarianza con Python
Per calcolare la covarianza in Python, utilizzare la funzione np.cov() della libreria NumPy. Questa funzione accetta due parametri: le sequenze di dati per cui si desidera calcolare la covarianza.
Il risultato si trova all'indice [0,1]. Questo corso non tratterà gli altri valori dell'output, fare riferimento all'esempio:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Questo indica che i valori si muovono nella stessa direzione. Questo è logico perché una superficie del negozio più ampia corrisponde a un numero maggiore di articoli. Un limite significativo della covarianza è che il valore può essere infinito.
Grazie per i tuoi commenti!