Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Sammenligning av Modeller | Sammenligning av Modeller
Klassifisering med Python

bookUtfordring: Sammenligning av Modeller

Nå skal du sammenligne modellene vi har gjennomgått ved å bruke ett datasett — breast cancer dataset. Målvariabelen er kolonnen 'diagnosis', der 1 representerer ondartede og 0 representerer godartede tilfeller.

Du skal bruke GridSearchCV på hver modell for å finne de beste parameterne. I denne oppgaven skal du bruke recall som evalueringsmetode fordi det er avgjørende å minimere falske negative. For å få GridSearchCV til å velge de beste parameterne basert på recall, sett scoring='recall'.

Oppgave

Swipe to start coding

Du har fått et brystkreftdatasett lagret som en DataFrame i variabelen df.

  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [3, 5, 7, 12] for n_neighbors og lagre det i variabelen knn_params.
  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [0.1, 1, 10] for C og lagre det i variabelen lr_params.
  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [2, 4, 6, 10] for max_depth og [1, 2, 4, 7] for min_samples_leaf, og lagre det i variabelen dt_params.
  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [2, 4, 6] for max_depth og [20, 50, 100] for n_estimators, og lagre det i variabelen rf_params.
  • Initialiser og tren et GridSearchCV-objekt for hver av modellene, og lagre de trente modellene i de respektive variablene: knn_grid, lr_grid, dt_grid og rf_grid.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 3
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 4.17

bookUtfordring: Sammenligning av Modeller

Sveip for å vise menyen

Nå skal du sammenligne modellene vi har gjennomgått ved å bruke ett datasett — breast cancer dataset. Målvariabelen er kolonnen 'diagnosis', der 1 representerer ondartede og 0 representerer godartede tilfeller.

Du skal bruke GridSearchCV på hver modell for å finne de beste parameterne. I denne oppgaven skal du bruke recall som evalueringsmetode fordi det er avgjørende å minimere falske negative. For å få GridSearchCV til å velge de beste parameterne basert på recall, sett scoring='recall'.

Oppgave

Swipe to start coding

Du har fått et brystkreftdatasett lagret som en DataFrame i variabelen df.

  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [3, 5, 7, 12] for n_neighbors og lagre det i variabelen knn_params.
  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [0.1, 1, 10] for C og lagre det i variabelen lr_params.
  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [2, 4, 6, 10] for max_depth og [1, 2, 4, 7] for min_samples_leaf, og lagre det i variabelen dt_params.
  • Opprett et ordbok for GridSearchCV som itererer gjennom verdiene [2, 4, 6] for max_depth og [20, 50, 100] for n_estimators, og lagre det i variabelen rf_params.
  • Initialiser og tren et GridSearchCV-objekt for hver av modellene, og lagre de trente modellene i de respektive variablene: knn_grid, lr_grid, dt_grid og rf_grid.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 3
single

single

some-alt