Udfordring: Sammenligning af Modeller
Nu skal du sammenligne de modeller, vi har gennemgået, ved hjælp af ét datasæt — breast cancer dataset. Målvariablen er kolonnen 'diagnosis', hvor 1 repræsenterer maligne og 0 repræsenterer benigne tilfælde.
Du skal anvende GridSearchCV på hver model for at finde de bedste parametre. I denne opgave skal du bruge recall som evalueringsmetrik, da minimering af falske negativer er afgørende. For at få GridSearchCV til at vælge de bedste parametre baseret på recall, skal du sætte scoring='recall'.
Swipe to start coding
Du har fået et brystkræft-datasæt, som er gemt som en DataFrame i variablen df.
- Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[3, 5, 7, 12]forn_neighbors, og gem den i variablenknn_params. - Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[0.1, 1, 10]forC, og gem den i variablenlr_params. - Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[2, 4, 6, 10]formax_depthog[1, 2, 4, 7]formin_samples_leaf, og gem den i variablendt_params. - Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[2, 4, 6]formax_depthog[20, 50, 100]forn_estimators, og gem den i variablenrf_params. - Initialiser og træn et
GridSearchCV-objekt for hver af modellerne, og gem de trænede modeller i de respektive variabler:knn_grid,lr_grid,dt_gridogrf_grid.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you show me how to set up GridSearchCV with recall as the scoring metric?
Which models should I compare using GridSearchCV?
Can you explain why recall is important in this context?
Awesome!
Completion rate improved to 4.17
Udfordring: Sammenligning af Modeller
Stryg for at vise menuen
Nu skal du sammenligne de modeller, vi har gennemgået, ved hjælp af ét datasæt — breast cancer dataset. Målvariablen er kolonnen 'diagnosis', hvor 1 repræsenterer maligne og 0 repræsenterer benigne tilfælde.
Du skal anvende GridSearchCV på hver model for at finde de bedste parametre. I denne opgave skal du bruge recall som evalueringsmetrik, da minimering af falske negativer er afgørende. For at få GridSearchCV til at vælge de bedste parametre baseret på recall, skal du sætte scoring='recall'.
Swipe to start coding
Du har fået et brystkræft-datasæt, som er gemt som en DataFrame i variablen df.
- Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[3, 5, 7, 12]forn_neighbors, og gem den i variablenknn_params. - Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[0.1, 1, 10]forC, og gem den i variablenlr_params. - Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[2, 4, 6, 10]formax_depthog[1, 2, 4, 7]formin_samples_leaf, og gem den i variablendt_params. - Opret en ordbog til
GridSearchCV, der itererer gennem værdierne[2, 4, 6]formax_depthog[20, 50, 100]forn_estimators, og gem den i variablenrf_params. - Initialiser og træn et
GridSearchCV-objekt for hver af modellerne, og gem de trænede modeller i de respektive variabler:knn_grid,lr_grid,dt_gridogrf_grid.
Løsning
Tak for dine kommentarer!
single