Kursinhalt
Lernen von Statistik mit Python
Lernen von Statistik mit Python
Kovarianz
Kovarianz ist ein Maß für die gemeinsame Variabilität von zwei Zufallsvariablen.
Der Wert der Kovarianz | Bedeutung |
---|---|
Positiv | Zwei Variablen bewegen sich in die gleiche Richtung |
0 | Zwei Variablen haben keine lineare Beziehung |
Negativ | Zwei Variablen bewegen sich in entgegengesetzte Richtungen |
Die Formeln unterscheiden sich für die Stichprobe und die Population, aber wir werden nicht tiefer darauf eingehen. In diesem Kapitel werden wir die Kovarianzen des folgenden Datensatzes besprechen:
Store_ID | Store_Area | Items_Available | Daily_Customer_Count | Store_Sales | |
---|---|---|---|---|---|
0 | 0 | 1659 | 1961 | 530 | 66490 |
1 | 1 | 1461 | 1752 | 210 | 39820 |
2 | 2 | 1340 | 1609 | 720 | 54010 |
3 | 3 | 1451 | 1748 | 620 | 53730 |
4 | 4 | 1770 | 2111 | 450 | 46620 |
Store_ID
- Die eindeutige ID des Geschäfts;Store_Area
- Die Fläche des Geschäfts;Items_Available
- Die Anzahl der im Geschäft verfügbaren Artikel;Daily_Customer_Count
- Die tägliche Anzahl der Kunden im Geschäft;Store_Sales
- Die Anzahl der Verkäufe im Geschäft.
Berechnung der Kovarianz mit Python:
Um die Kovarianz in Python zu berechnen, können Sie die Funktion np.cov()
aus der NumPy-Bibliothek verwenden. Sie benötigt zwei Parameter: die Datenreihen, für die Sie die Kovarianz berechnen möchten.
Das Ergebnis ist der Wert an der Stelle [0,1]. Dieser Kurs behandelt die anderen Werte im Ergebnis nicht, siehe das Beispiel:
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Dies zeigt an, dass sich die Werte in die gleiche Richtung bewegen. Das ist sinnvoll, da eine größere Geschäftsfläche mit einer größeren Anzahl von Artikeln korrespondiert. Ein wesentlicher Nachteil der Kovarianz ist, dass der Wert unendlich sein kann.
Danke für Ihr Feedback!