Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Kovarianz | Kovarianz vs. Korrelation
Lernen von Statistik mit Python
course content

Kursinhalt

Lernen von Statistik mit Python

Lernen von Statistik mit Python

1. Grundkonzepte
2. Mittelwert, Median und Modus mit Python
3. Varianz und Standardabweichung
4. Kovarianz vs. Korrelation
5. Konfidenzintervall
6. Statistisches Testen

book
Kovarianz

Kovarianz ist ein Maß für die gemeinsame Variabilität von zwei Zufallsvariablen.

Der Wert der KovarianzBedeutung
PositivZwei Variablen bewegen sich in die gleiche Richtung
0Zwei Variablen haben keine lineare Beziehung
NegativZwei Variablen bewegen sich in entgegengesetzte Richtungen

Die Formeln unterscheiden sich für die Stichprobe und die Population, aber wir werden nicht tiefer darauf eingehen. In diesem Kapitel werden wir die Kovarianzen des folgenden Datensatzes besprechen:

Store_IDStore_AreaItems_AvailableDaily_Customer_CountStore_Sales
001659196153066490
111461175221039820
221340160972054010
331451174862053730
441770211145046620
  • Store_ID - Die eindeutige ID des Geschäfts;
  • Store_Area - Die Fläche des Geschäfts;
  • Items_Available - Die Anzahl der im Geschäft verfügbaren Artikel;
  • Daily_Customer_Count - Die tägliche Anzahl der Kunden im Geschäft;
  • Store_Sales - Die Anzahl der Verkäufe im Geschäft.

Berechnung der Kovarianz mit Python:

Um die Kovarianz in Python zu berechnen, können Sie die Funktion np.cov() aus der NumPy-Bibliothek verwenden. Sie benötigt zwei Parameter: die Datenreihen, für die Sie die Kovarianz berechnen möchten.

Das Ergebnis ist der Wert an der Stelle [0,1]. Dieser Kurs behandelt die anderen Werte im Ergebnis nicht, siehe das Beispiel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Dies zeigt an, dass sich die Werte in die gleiche Richtung bewegen. Das ist sinnvoll, da eine größere Geschäftsfläche mit einer größeren Anzahl von Artikeln korrespondiert. Ein wesentlicher Nachteil der Kovarianz ist, dass der Wert unendlich sein kann.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 1
We're sorry to hear that something went wrong. What happened?
some-alt