Summary  
This chapter explains how to tune model hyperparameters by combining cross-validation with GridSearchCV or RandomizedSearchCV in a workflow that splits data into training, validation, and test sets to optimize and evaluate machine learning pipelines.

General domain of usage  
Machine learning model evaluation and selection

Du vet nå hvordan du bygger en **modell**, bruker **pipelines** og justerer **hyperparametere**. Du har også lært to evalueringsmetoder: train-test split og kryssvalidering.
Neste steg er å kombinere evaluering og justering ved å bruke `GridSearchCV` eller `RandomizedSearchCV`.

Siden datasettet vårt er lite, vil vi bruke `GridSearchCV`, men alt som sies nedenfor gjelder også for en `RandomizedSearchCV`.

Merk

Siden kryssvalidering er mer stabilt enn en enkel train-test split, er målet å oppnå **høyest mulig kryssvalideringsscore**.
`GridSearchCV` søker gjennom hyperparametere og finner de som maksimerer denne scoren. Den beste scoren lagres i `.best_score_`.

Hyperparametere som fungerer best for ett datasett, kan **ikke generaliseres** når nye data kommer inn.
Dermed kan `.best_score_` være høyere enn modellens ytelse på **helt ukjente** data.

En vanlig arbeidsflyt: del opp i trenings- og testsett; kjør kryssvalidering på **treningssettet** for å justere modellen; evaluer deretter den optimaliserte modellen på **testsettet** for å måle ytelse i virkelige situasjoner.

Oppsummert:

1. Forbehandle dataene;
2. Del opp i trenings- og testsett;
3. Bruk kryssvalidering på treningssettet for å finne den beste konfigurasjonen;
4. Evaluer på testsettet.

Det tredje steget innebærer vanligvis å teste **flere algoritmer** og justere deres hyperparametere for å identifisere det beste alternativet. For enkelhets skyld ble kun én algoritme brukt i dette kurset.


Les mer

Kryssvalidering er ikke alltid det beste alternativet. For store datasett blir beregning av CV-score kostbart, mens et trenings- og testsett gir mer stabile resultater takket være et stort testsett.

Store datasett deles ofte inn i **treningssett**, **valideringssett** og **testsett**.
Hyperparametere velges basert på ytelse på **valideringssettet**.
Til slutt evalueres den valgte modellen på **testsettet** for å verifisere hvor godt den generaliserer.

**Penguins-datasettet** er lite, med kun 342 forekomster. På grunn av denne begrensede størrelsen vil kryssvalideringsscore brukes til evaluering i neste kapittel.


Hvorfor er kryssvalidering spesielt verdifull for hyperparametertuning i mindre datasett, i motsetning til større datasett hvor trenings- og testdeling ofte foretrekkes?

Maskinlæring brukes nå overalt. Vil du lære det selv? Dette kurset er en introduksjon til maskinlæring hvor du lærer grunnleggende konsepter, arbeider med Scikit-learn – det mest populære biblioteket for ML, og bygger ditt første maskinlæringsprosjekt.
Kurset er beregnet på studenter med grunnleggende kunnskaper i Python, Pandas og Numpy.

Lær om maskinlæringskonsepter og arbeidsflyten i et ML-prosjekt.

Forbehandling er sannsynligvis den viktigste fasen i et ML-prosjekt. Dette kapittelet dekker forbehandlingsstegene som trengs for nesten alle datasett.

En pipeline er en ryddig måte å kombinere alle forhåndsprosesseringssteg samt en modell. Pipeliner gjør det mye enklere å trene og bruke en modell.

Modellering er den mest spennende fasen i et ML-prosjekt. La oss lære å bygge, finjustere og evaluere modellen!

Oppsummering av modellering