Mikä on logistinen regressio
Logistinen regressio on itse asiassa luokittelualgoritmi, vaikka sen nimessä esiintyy sana "regressio".
Nimensä se saa, koska se perustuu lineaariseen regressioon, mutta käyttää logistista (sigmoidista) funktiota muuntaakseen tuloksen todennäköisyyksiksi, jolloin se voi luokitella dataa kategorioihin jatkuvien arvojen ennustamisen sijaan.
Oletetaan, että halutaan ennustaa, jättääkö henkilö maksamatta ensimmäisen lainansa (ei luottohistoriaa saatavilla).
Lineaarisessa regressiossa rakennetaan yhtälö numeeristen arvojen ennustamiseen. Samaa yhtälöä voidaan käyttää laskemaan "luotettavuuspisteet". Siinä otetaan huomioon ominaisuudet, kuten tulot, nykyisen työsuhteen kesto, velkaantumisaste jne. Korkeampi luotettavuuspiste tarkoittaa pienempää maksulaiminlyönnin todennäköisyyttä.
β-arvot ovat parametreja, jotka mallin täytyy oppia. Koulutuksen aikana tietokone säätää näitä arvoja tehdäkseen parempia ennusteita. Tämä tapahtuu yrittämällä minimoida erotuksen ennustettujen tulosten ja todellisten luokkien välillä – tätä erotusta mitataan niin sanotulla häviöfunktiolla.
Muuntaakseen mallin raakatuotoksen luokkamerkinnäksi (0 tai 1), logistinen regressio käyttää sigmoidifunktiota. Tämä funktio ottaa minkä tahansa reaaliluvun ja puristaa sen välille 0 ja 1, jolloin sitä voidaan tulkita todennäköisyytenä.
Sigmoidifunktio määritellään seuraavasti:
σ(z)=1+e−z1Tässä z on pistemäärä (myös nimeltään logit), jonka laskimme aiemmin.
Kun on kaksi luokkaa: 1 (henkilö jättää ensimmäisen lainan maksamatta) ja 0 (henkilö ei jätä ensimmäistä lainaa maksamatta), sigmoidin soveltamisen jälkeen saamme todennäköisyyden, että havainto kuuluu luokkaan 1.
Lopullisen päätöksen tekemiseksi (0 tai 1) vertaamme todennäköisyyttä kynnykseen – yleensä 0,5:
- Jos todennäköisyys on suurempi kuin 0,5, ennustamme 1;
- Jos se on pienempi tai yhtä suuri kuin 0,5, ennustamme 0.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain why logistic regression is used for classification instead of regression?
How does the loss function work in logistic regression?
What is the significance of the sigmoid function in logistic regression?
Awesome!
Completion rate improved to 4.17
Mikä on logistinen regressio
Pyyhkäise näyttääksesi valikon
Logistinen regressio on itse asiassa luokittelualgoritmi, vaikka sen nimessä esiintyy sana "regressio".
Nimensä se saa, koska se perustuu lineaariseen regressioon, mutta käyttää logistista (sigmoidista) funktiota muuntaakseen tuloksen todennäköisyyksiksi, jolloin se voi luokitella dataa kategorioihin jatkuvien arvojen ennustamisen sijaan.
Oletetaan, että halutaan ennustaa, jättääkö henkilö maksamatta ensimmäisen lainansa (ei luottohistoriaa saatavilla).
Lineaarisessa regressiossa rakennetaan yhtälö numeeristen arvojen ennustamiseen. Samaa yhtälöä voidaan käyttää laskemaan "luotettavuuspisteet". Siinä otetaan huomioon ominaisuudet, kuten tulot, nykyisen työsuhteen kesto, velkaantumisaste jne. Korkeampi luotettavuuspiste tarkoittaa pienempää maksulaiminlyönnin todennäköisyyttä.
β-arvot ovat parametreja, jotka mallin täytyy oppia. Koulutuksen aikana tietokone säätää näitä arvoja tehdäkseen parempia ennusteita. Tämä tapahtuu yrittämällä minimoida erotuksen ennustettujen tulosten ja todellisten luokkien välillä – tätä erotusta mitataan niin sanotulla häviöfunktiolla.
Muuntaakseen mallin raakatuotoksen luokkamerkinnäksi (0 tai 1), logistinen regressio käyttää sigmoidifunktiota. Tämä funktio ottaa minkä tahansa reaaliluvun ja puristaa sen välille 0 ja 1, jolloin sitä voidaan tulkita todennäköisyytenä.
Sigmoidifunktio määritellään seuraavasti:
σ(z)=1+e−z1Tässä z on pistemäärä (myös nimeltään logit), jonka laskimme aiemmin.
Kun on kaksi luokkaa: 1 (henkilö jättää ensimmäisen lainan maksamatta) ja 0 (henkilö ei jätä ensimmäistä lainaa maksamatta), sigmoidin soveltamisen jälkeen saamme todennäköisyyden, että havainto kuuluu luokkaan 1.
Lopullisen päätöksen tekemiseksi (0 tai 1) vertaamme todennäköisyyttä kynnykseen – yleensä 0,5:
- Jos todennäköisyys on suurempi kuin 0,5, ennustamme 1;
- Jos se on pienempi tai yhtä suuri kuin 0,5, ennustamme 0.
Kiitos palautteestasi!