Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Mallien Vertailu | Mallien Vertailu
Luokittelu Pythonilla

bookHaaste: Mallien Vertailu

Nyt vertailet aiemmin käsiteltyjä malleja käyttäen yhtä ja samaa aineistoa — rintasyöpäaineistoa. Kohdemuuttuja on 'diagnosis'-sarake, jossa 1 tarkoittaa pahanlaatuista ja 0 hyvänlaatuista tapausta.

Sovellat GridSearchCV:tä jokaiseen malliin löytääksesi parhaat parametrit. Tässä tehtävässä käytät herkkyyttä (recall) arviointimittarina, koska väärien negatiivisten minimointi on ratkaisevaa. Jotta GridSearchCV valitsee parhaat parametrit herkkyyden perusteella, aseta scoring='recall'.

Tehtävä

Swipe to start coding

Sinulle on annettu rintasyöpäaineisto, joka on tallennettu DataFrame-muodossa muuttujaan df.

  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [3, 5, 7, 12] parametrille n_neighbors ja tallenna se muuttujaan knn_params.
  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [0.1, 1, 10] parametrille C ja tallenna se muuttujaan lr_params.
  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [2, 4, 6, 10] parametrille max_depth ja arvot [1, 2, 4, 7] parametrille min_samples_leaf, ja tallenna se muuttujaan dt_params.
  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [2, 4, 6] parametrille max_depth ja arvot [20, 50, 100] parametrille n_estimators, ja tallenna se muuttujaan rf_params.
  • Alusta ja kouluta GridSearchCV-olio jokaiselle mallille ja tallenna koulutetut mallit seuraaviin muuttujiin: knn_grid, lr_grid, dt_grid ja rf_grid.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 3
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you show me how to set up GridSearchCV with recall as the scoring metric?

Which models should I compare using GridSearchCV?

Can you explain why recall is important in this context?

close

Awesome!

Completion rate improved to 4.17

bookHaaste: Mallien Vertailu

Pyyhkäise näyttääksesi valikon

Nyt vertailet aiemmin käsiteltyjä malleja käyttäen yhtä ja samaa aineistoa — rintasyöpäaineistoa. Kohdemuuttuja on 'diagnosis'-sarake, jossa 1 tarkoittaa pahanlaatuista ja 0 hyvänlaatuista tapausta.

Sovellat GridSearchCV:tä jokaiseen malliin löytääksesi parhaat parametrit. Tässä tehtävässä käytät herkkyyttä (recall) arviointimittarina, koska väärien negatiivisten minimointi on ratkaisevaa. Jotta GridSearchCV valitsee parhaat parametrit herkkyyden perusteella, aseta scoring='recall'.

Tehtävä

Swipe to start coding

Sinulle on annettu rintasyöpäaineisto, joka on tallennettu DataFrame-muodossa muuttujaan df.

  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [3, 5, 7, 12] parametrille n_neighbors ja tallenna se muuttujaan knn_params.
  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [0.1, 1, 10] parametrille C ja tallenna se muuttujaan lr_params.
  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [2, 4, 6, 10] parametrille max_depth ja arvot [1, 2, 4, 7] parametrille min_samples_leaf, ja tallenna se muuttujaan dt_params.
  • Luo sanakirja GridSearchCV:lle, jotta se käy läpi arvot [2, 4, 6] parametrille max_depth ja arvot [20, 50, 100] parametrille n_estimators, ja tallenna se muuttujaan rf_params.
  • Alusta ja kouluta GridSearchCV-olio jokaiselle mallille ja tallenna koulutetut mallit seuraaviin muuttujiin: knn_grid, lr_grid, dt_grid ja rf_grid.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 3
single

single

some-alt