Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Mikä on logistinen regressio | Logistinen Regressio
Luokittelu Pythonilla

bookMikä on logistinen regressio

Logistinen regressio on itse asiassa luokittelualgoritmi, vaikka sen nimessä esiintyy sana "regressio".

Nimensä se saa, koska se perustuu lineaariseen regressioon, mutta käyttää logistista (sigmoidista) funktiota muuntaakseen tuloksen todennäköisyyksiksi, jolloin se voi luokitella dataa kategorioihin jatkuvien arvojen ennustamisen sijaan.

Oletetaan, että halutaan ennustaa, jättääkö henkilö maksamatta ensimmäisen lainansa (ei luottohistoriaa saatavilla).

Lineaarisessa regressiossa rakennetaan yhtälö numeeristen arvojen ennustamiseen. Samaa yhtälöä voidaan käyttää laskemaan "luotettavuuspisteet". Siinä otetaan huomioon ominaisuudet, kuten tulot, nykyisen työsuhteen kesto, velkaantumisaste jne. Korkeampi luotettavuuspiste tarkoittaa pienempää maksulaiminlyönnin todennäköisyyttä.

β\beta-arvot ovat parametreja, jotka mallin täytyy oppia. Koulutuksen aikana tietokone säätää näitä arvoja tehdäkseen parempia ennusteita. Tämä tapahtuu yrittämällä minimoida erotuksen ennustettujen tulosten ja todellisten luokkien välillä – tätä erotusta mitataan niin sanotulla häviöfunktiolla.

Muuntaakseen mallin raakatuotoksen luokkamerkinnäksi (0 tai 1), logistinen regressio käyttää sigmoidifunktiota. Tämä funktio ottaa minkä tahansa reaaliluvun ja puristaa sen välille 0 ja 1, jolloin sitä voidaan tulkita todennäköisyytenä.

Sigmoidifunktio määritellään seuraavasti:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Tässä zz on pistemäärä (myös nimeltään logit), jonka laskimme aiemmin.

Kun on kaksi luokkaa: 1 (henkilö jättää ensimmäisen lainan maksamatta) ja 0 (henkilö ei jätä ensimmäistä lainaa maksamatta), sigmoidin soveltamisen jälkeen saamme todennäköisyyden, että havainto kuuluu luokkaan 1.

Lopullisen päätöksen tekemiseksi (0 tai 1) vertaamme todennäköisyyttä kynnykseen – yleensä 0,5:

  • Jos todennäköisyys on suurempi kuin 0,5, ennustamme 1;
  • Jos se on pienempi tai yhtä suuri kuin 0,5, ennustamme 0.
question mark

Valitse kaikki oikeat väittämät.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain why logistic regression is used for classification instead of regression?

How does the loss function work in logistic regression?

What is the significance of the sigmoid function in logistic regression?

Awesome!

Completion rate improved to 4.17

bookMikä on logistinen regressio

Pyyhkäise näyttääksesi valikon

Logistinen regressio on itse asiassa luokittelualgoritmi, vaikka sen nimessä esiintyy sana "regressio".

Nimensä se saa, koska se perustuu lineaariseen regressioon, mutta käyttää logistista (sigmoidista) funktiota muuntaakseen tuloksen todennäköisyyksiksi, jolloin se voi luokitella dataa kategorioihin jatkuvien arvojen ennustamisen sijaan.

Oletetaan, että halutaan ennustaa, jättääkö henkilö maksamatta ensimmäisen lainansa (ei luottohistoriaa saatavilla).

Lineaarisessa regressiossa rakennetaan yhtälö numeeristen arvojen ennustamiseen. Samaa yhtälöä voidaan käyttää laskemaan "luotettavuuspisteet". Siinä otetaan huomioon ominaisuudet, kuten tulot, nykyisen työsuhteen kesto, velkaantumisaste jne. Korkeampi luotettavuuspiste tarkoittaa pienempää maksulaiminlyönnin todennäköisyyttä.

β\beta-arvot ovat parametreja, jotka mallin täytyy oppia. Koulutuksen aikana tietokone säätää näitä arvoja tehdäkseen parempia ennusteita. Tämä tapahtuu yrittämällä minimoida erotuksen ennustettujen tulosten ja todellisten luokkien välillä – tätä erotusta mitataan niin sanotulla häviöfunktiolla.

Muuntaakseen mallin raakatuotoksen luokkamerkinnäksi (0 tai 1), logistinen regressio käyttää sigmoidifunktiota. Tämä funktio ottaa minkä tahansa reaaliluvun ja puristaa sen välille 0 ja 1, jolloin sitä voidaan tulkita todennäköisyytenä.

Sigmoidifunktio määritellään seuraavasti:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Tässä zz on pistemäärä (myös nimeltään logit), jonka laskimme aiemmin.

Kun on kaksi luokkaa: 1 (henkilö jättää ensimmäisen lainan maksamatta) ja 0 (henkilö ei jätä ensimmäistä lainaa maksamatta), sigmoidin soveltamisen jälkeen saamme todennäköisyyden, että havainto kuuluu luokkaan 1.

Lopullisen päätöksen tekemiseksi (0 tai 1) vertaamme todennäköisyyttä kynnykseen – yleensä 0,5:

  • Jos todennäköisyys on suurempi kuin 0,5, ennustamme 1;
  • Jos se on pienempi tai yhtä suuri kuin 0,5, ennustamme 0.
question mark

Valitse kaikki oikeat väittämät.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1
some-alt