Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Korrelation | Kovarians vs Korrelation
Lær Statistik med Python
course content

Kursusindhold

Lær Statistik med Python

Lær Statistik med Python

1. Grundlæggende Begreber
2. Gennemsnit, Median og Typetal med Python
3. Varians og Standardafvigelse
4. Kovarians vs Korrelation
5. Konfidensinterval
6. Statistisk Testning

book
Korrelation

Korrelation er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.

Korrelation giver en enkel måde at undersøge resultatet på. Korrelationens værdi ligger inden for intervallet [-1, 1]. Se tabellen nedenfor:

Korrelation med Python

For at beregne korrelation anvendes funktionen np.corrcoef() fra numpy, som kræver to parametre: dataserierne, hvor korrelationen skal beregnes. Her er et eksempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Her udtrak vi værdien ved indeks [0, 1], ligesom i tilfældet med kovarians. I det forrige kapitel opnåede vi værdien 74955.85, og det kan være udfordrende at fortolke resultatet af kovariationsfunktionen. I dette tilfælde kan vi dog konkludere, at værdierne er stærkt relaterede.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2

Spørg AI

expand
ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

course content

Kursusindhold

Lær Statistik med Python

Lær Statistik med Python

1. Grundlæggende Begreber
2. Gennemsnit, Median og Typetal med Python
3. Varians og Standardafvigelse
4. Kovarians vs Korrelation
5. Konfidensinterval
6. Statistisk Testning

book
Korrelation

Korrelation er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.

Korrelation giver en enkel måde at undersøge resultatet på. Korrelationens værdi ligger inden for intervallet [-1, 1]. Se tabellen nedenfor:

Korrelation med Python

For at beregne korrelation anvendes funktionen np.corrcoef() fra numpy, som kræver to parametre: dataserierne, hvor korrelationen skal beregnes. Her er et eksempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Her udtrak vi værdien ved indeks [0, 1], ligesom i tilfældet med kovarians. I det forrige kapitel opnåede vi værdien 74955.85, og det kan være udfordrende at fortolke resultatet af kovariationsfunktionen. I dette tilfælde kan vi dog konkludere, at værdierne er stærkt relaterede.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2
Vi beklager, at noget gik galt. Hvad skete der?
some-alt