Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Sammenligning af Modeller | Sammenligning af Modeller
Klassifikation med Python

bookUdfordring: Sammenligning af Modeller

Nu skal du sammenligne de modeller, vi har gennemgået, ved hjælp af ét datasæt — breast cancer dataset. Målvariablen er kolonnen 'diagnosis', hvor 1 repræsenterer maligne og 0 repræsenterer benigne tilfælde.

Du skal anvende GridSearchCV på hver model for at finde de bedste parametre. I denne opgave skal du bruge recall som evalueringsmetrik, da minimering af falske negativer er afgørende. For at få GridSearchCV til at vælge de bedste parametre baseret på recall, skal du sætte scoring='recall'.

Opgave

Swipe to start coding

Du har fået et brystkræft-datasæt, som er gemt som en DataFrame i variablen df.

  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [3, 5, 7, 12] for n_neighbors, og gem den i variablen knn_params.
  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [0.1, 1, 10] for C, og gem den i variablen lr_params.
  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [2, 4, 6, 10] for max_depth og [1, 2, 4, 7] for min_samples_leaf, og gem den i variablen dt_params.
  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [2, 4, 6] for max_depth og [20, 50, 100] for n_estimators, og gem den i variablen rf_params.
  • Initialiser og træn et GridSearchCV-objekt for hver af modellerne, og gem de trænede modeller i de respektive variabler: knn_grid, lr_grid, dt_grid og rf_grid.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 3
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you show me how to set up GridSearchCV with recall as the scoring metric?

Which models should I compare using GridSearchCV?

Can you explain why recall is important in this context?

close

Awesome!

Completion rate improved to 4.17

bookUdfordring: Sammenligning af Modeller

Stryg for at vise menuen

Nu skal du sammenligne de modeller, vi har gennemgået, ved hjælp af ét datasæt — breast cancer dataset. Målvariablen er kolonnen 'diagnosis', hvor 1 repræsenterer maligne og 0 repræsenterer benigne tilfælde.

Du skal anvende GridSearchCV på hver model for at finde de bedste parametre. I denne opgave skal du bruge recall som evalueringsmetrik, da minimering af falske negativer er afgørende. For at få GridSearchCV til at vælge de bedste parametre baseret på recall, skal du sætte scoring='recall'.

Opgave

Swipe to start coding

Du har fået et brystkræft-datasæt, som er gemt som en DataFrame i variablen df.

  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [3, 5, 7, 12] for n_neighbors, og gem den i variablen knn_params.
  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [0.1, 1, 10] for C, og gem den i variablen lr_params.
  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [2, 4, 6, 10] for max_depth og [1, 2, 4, 7] for min_samples_leaf, og gem den i variablen dt_params.
  • Opret en ordbog til GridSearchCV, der itererer gennem værdierne [2, 4, 6] for max_depth og [20, 50, 100] for n_estimators, og gem den i variablen rf_params.
  • Initialiser og træn et GridSearchCV-objekt for hver af modellerne, og gem de trænede modeller i de respektive variabler: knn_grid, lr_grid, dt_grid og rf_grid.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 3
single

single

some-alt