Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Hvad Er Logistisk Regression | Logistisk Regression
Klassifikation med Python

bookHvad Er Logistisk Regression

Logistisk regression er faktisk en klassifikationsalgoritme, på trods af ordet "Regression" i navnet.

Den har fået sit navn, fordi den er baseret på lineær regression, men den anvender en logistisk (sigmoid) funktion til at omdanne output til sandsynligheder, hvilket gør det muligt at klassificere data i kategorier i stedet for at forudsige kontinuerlige værdier.

Antag, at du ønsker at forudsige, om en person vil misligholde et første lån (ingen kredit historik tilgængelig).

Ved lineær regression opstiller vi en ligning for at forudsige numeriske værdier. Vi kan bruge den samme ligning til at beregne en "pålidelighedsscore". Den vil tage højde for egenskaber som indkomst, varighed af nuværende ansættelse, gæld-i-forhold-til-indkomst-forhold osv. En højere pålidelighedsscore betyder en lavere sandsynlighed for misligholdelse.

β\beta-værdierne er de parametre, som modellen skal lære. Under træningen justerer computeren disse værdier for at opnå bedre forudsigelser. Dette sker ved at forsøge at minimere forskellen mellem de forudsagte resultater og de faktiske etiketter – denne forskel måles ved hjælp af noget, der kaldes tab-funktionen.

For at omdanne modellens rå output til en klasselabel (0 eller 1), anvender logistisk regression en sigmoidfunktion. Denne funktion tager et vilkårligt reelt tal og presser det ind i et interval mellem 0 og 1, hvilket gør det fortolkeligt som en sandsynlighed.

Sigmoidfunktionen er defineret som:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Her er zz scoren (også kaldet logit), som vi tidligere har beregnet.

Givet to klasser: 1 (en person vil misligholde et første lån) og 0 (en person vil ikke misligholde et første lån), får vi efter anvendelse af sigmoidfunktionen sandsynligheden for, at instansen tilhører klasse 1.

For at træffe en endelig beslutning (0 eller 1), sammenlignes sandsynligheden med en tærskel – typisk 0,5:

  • Hvis sandsynligheden er større end 0,5, forudsiges 1;
  • Hvis den er mindre end eller lig med 0,5, forudsiges 0.
question mark

Vælg alle de korrekte udsagn.

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 4.17

bookHvad Er Logistisk Regression

Stryg for at vise menuen

Logistisk regression er faktisk en klassifikationsalgoritme, på trods af ordet "Regression" i navnet.

Den har fået sit navn, fordi den er baseret på lineær regression, men den anvender en logistisk (sigmoid) funktion til at omdanne output til sandsynligheder, hvilket gør det muligt at klassificere data i kategorier i stedet for at forudsige kontinuerlige værdier.

Antag, at du ønsker at forudsige, om en person vil misligholde et første lån (ingen kredit historik tilgængelig).

Ved lineær regression opstiller vi en ligning for at forudsige numeriske værdier. Vi kan bruge den samme ligning til at beregne en "pålidelighedsscore". Den vil tage højde for egenskaber som indkomst, varighed af nuværende ansættelse, gæld-i-forhold-til-indkomst-forhold osv. En højere pålidelighedsscore betyder en lavere sandsynlighed for misligholdelse.

β\beta-værdierne er de parametre, som modellen skal lære. Under træningen justerer computeren disse værdier for at opnå bedre forudsigelser. Dette sker ved at forsøge at minimere forskellen mellem de forudsagte resultater og de faktiske etiketter – denne forskel måles ved hjælp af noget, der kaldes tab-funktionen.

For at omdanne modellens rå output til en klasselabel (0 eller 1), anvender logistisk regression en sigmoidfunktion. Denne funktion tager et vilkårligt reelt tal og presser det ind i et interval mellem 0 og 1, hvilket gør det fortolkeligt som en sandsynlighed.

Sigmoidfunktionen er defineret som:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Her er zz scoren (også kaldet logit), som vi tidligere har beregnet.

Givet to klasser: 1 (en person vil misligholde et første lån) og 0 (en person vil ikke misligholde et første lån), får vi efter anvendelse af sigmoidfunktionen sandsynligheden for, at instansen tilhører klasse 1.

For at træffe en endelig beslutning (0 eller 1), sammenlignes sandsynligheden med en tærskel – typisk 0,5:

  • Hvis sandsynligheden er større end 0,5, forudsiges 1;
  • Hvis den er mindre end eller lig med 0,5, forudsiges 0.
question mark

Vælg alle de korrekte udsagn.

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1
some-alt