Covarianza
Covarianza è una misura della variabilità congiunta di due variabili casuali.
Le formule per la covarianza campionaria e popolazione differiscono, ma non saranno discusse in dettaglio qui. Questo capitolo si concentra sul calcolo della covarianza per il seguente dataset:
Store_ID: the unique id of the store;Store_Area: the area of the store;Items_Available: the number of items that are available in the store;Daily_Customer_Count: the daily number of customers in the store;Store_Sales: the number of sales in the store.
Calcolo della covarianza con Python
Per calcolare la covarianza in Python, utilizzare la funzione np.cov() della libreria NumPy. Questa funzione accetta due parametri: le sequenze di dati per cui si desidera calcolare la covarianza.
Il risultato si trova all'indice [0,1]. Questo corso non tratterà gli altri valori dell'output, fare riferimento all'esempio:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Questo indica che i valori si muovono nella stessa direzione. Questo è logico perché una superficie del negozio più ampia corrisponde a un numero maggiore di articoli. Un limite significativo della covarianza è che il valore può essere infinito.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain what the other values in the np.cov() output mean?
How does covariance differ from correlation?
Can you show how to interpret a negative covariance with an example?
Awesome!
Completion rate improved to 2.63
Covarianza
Scorri per mostrare il menu
Covarianza è una misura della variabilità congiunta di due variabili casuali.
Le formule per la covarianza campionaria e popolazione differiscono, ma non saranno discusse in dettaglio qui. Questo capitolo si concentra sul calcolo della covarianza per il seguente dataset:
Store_ID: the unique id of the store;Store_Area: the area of the store;Items_Available: the number of items that are available in the store;Daily_Customer_Count: the daily number of customers in the store;Store_Sales: the number of sales in the store.
Calcolo della covarianza con Python
Per calcolare la covarianza in Python, utilizzare la funzione np.cov() della libreria NumPy. Questa funzione accetta due parametri: le sequenze di dati per cui si desidera calcolare la covarianza.
Il risultato si trova all'indice [0,1]. Questo corso non tratterà gli altri valori dell'output, fare riferimento all'esempio:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Questo indica che i valori si muovono nella stessa direzione. Questo è logico perché una superficie del negozio più ampia corrisponde a un numero maggiore di articoli. Un limite significativo della covarianza è che il valore può essere infinito.
Grazie per i tuoi commenti!