Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Oppsummering av Modellering | Modellering
ML-Introduksjon med Scikit-learn

bookOppsummering av Modellering

Du har nå lært hvordan du bygger en modell, integrerer den i en pipeline, og tuner hyperparametere. To evalueringsmetoder er også dekket: train-test-splitt og kryssvalidering.

Neste steg er å kombinere modellevaluering med hyperparametertuning ved bruk av GridSearchCV eller RandomizedSearchCV.

Note
Merk

Siden datasettet vårt er lite, vil vi bruke GridSearchCV, men alt som nevnes nedenfor gjelder også for RandomizedSearchCV.

Målet er å oppnå høyest mulig kryssvalideringsscore på datasettet, siden kryssvalidering er mer stabilt og mindre avhengig av hvordan dataene deles enn train-test-metoden.

GridSearchCV er spesielt utviklet for dette formålet: den identifiserer hyperparametere som gir best kryssvalideringsscore, og produserer en finjustert modell som presterer optimalt på treningsdataene.

Attributtet .best_score_ lagrer den høyeste kryssvalideringsscoren som ble funnet under søket.

Note
Merk

De beste hyperparametrene for ett spesifikt datasett er ikke nødvendigvis de beste generelt. Hvis nye data legges til, kan de optimale hyperparametrene endres.

Dermed kan .best_score_ som oppnås være høyere enn ytelsen på helt ukjente data, siden hyperparametrene kanskje ikke generaliserer like godt utover treningsdatasettet.

Vanligvis deles datasettet først inn i trenings- og testsett. Kryssvalidering brukes deretter på treningssettet for å finjustere modellen og identifisere den beste konfigurasjonen. Til slutt evalueres den optimaliserte modellen på testsettet, som inneholder helt ukjente data, for å vurdere dens reelle ytelse.

Oppsummert består hele arbeidsflyten av:

  1. Forbehandling av data;
  2. Deling av datasettet i trenings- og testsett;
  3. Bruk av kryssvalidering på treningssettet for å finne den best presterende modellen;
  4. Evaluering av denne modellen på testsettet.
Note
Les mer

Det tredje steget innebærer vanligvis å teste flere algoritmer og justere deres hyperparametre for å identifisere det beste alternativet. For enkelhets skyld ble kun én algoritme brukt i dette kurset.

Før du går videre til den siste utfordringen, er det viktig å merke seg at kryssvalidering ikke er den eneste metoden for å finjustere modeller. Etter hvert som datasett blir større, tar det mer tid å beregne kryssvalideringsscore, og det vanlige trenings-/test-splittet gir mer stabilitet på grunn av den økte størrelsen på testsettet.

Derfor deles store datasett ofte inn i tre sett: et treningssett, et valideringssett og et testsett. Modellen trenes på treningssettet og evalueres på valideringssettet for å velge modellen eller hyperparametrene som presterer best.

Dette valget bruker valideringssettets score i stedet for kryssvalideringsscore. Til slutt vurderes den valgte modellen på testsettet, som består av helt ukjente data, for å verifisere ytelsen.

Pingvindatasettet er lite, med kun 342 forekomster. På grunn av denne begrensede størrelsen vil kryssvalideringsscore bli brukt til evaluering i neste kapittel.

question mark

Hvorfor er kryssvalidering spesielt verdifullt for hyperparametertuning i mindre datasett, i motsetning til større datasett hvor trenings- og testdeling ofte foretrekkes?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 9

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

What is the difference between cross-validation and the train-test split?

How does GridSearchCV help in hyperparameter tuning?

Why is a validation set used for large datasets?

Awesome!

Completion rate improved to 3.13

bookOppsummering av Modellering

Sveip for å vise menyen

Du har nå lært hvordan du bygger en modell, integrerer den i en pipeline, og tuner hyperparametere. To evalueringsmetoder er også dekket: train-test-splitt og kryssvalidering.

Neste steg er å kombinere modellevaluering med hyperparametertuning ved bruk av GridSearchCV eller RandomizedSearchCV.

Note
Merk

Siden datasettet vårt er lite, vil vi bruke GridSearchCV, men alt som nevnes nedenfor gjelder også for RandomizedSearchCV.

Målet er å oppnå høyest mulig kryssvalideringsscore på datasettet, siden kryssvalidering er mer stabilt og mindre avhengig av hvordan dataene deles enn train-test-metoden.

GridSearchCV er spesielt utviklet for dette formålet: den identifiserer hyperparametere som gir best kryssvalideringsscore, og produserer en finjustert modell som presterer optimalt på treningsdataene.

Attributtet .best_score_ lagrer den høyeste kryssvalideringsscoren som ble funnet under søket.

Note
Merk

De beste hyperparametrene for ett spesifikt datasett er ikke nødvendigvis de beste generelt. Hvis nye data legges til, kan de optimale hyperparametrene endres.

Dermed kan .best_score_ som oppnås være høyere enn ytelsen på helt ukjente data, siden hyperparametrene kanskje ikke generaliserer like godt utover treningsdatasettet.

Vanligvis deles datasettet først inn i trenings- og testsett. Kryssvalidering brukes deretter på treningssettet for å finjustere modellen og identifisere den beste konfigurasjonen. Til slutt evalueres den optimaliserte modellen på testsettet, som inneholder helt ukjente data, for å vurdere dens reelle ytelse.

Oppsummert består hele arbeidsflyten av:

  1. Forbehandling av data;
  2. Deling av datasettet i trenings- og testsett;
  3. Bruk av kryssvalidering på treningssettet for å finne den best presterende modellen;
  4. Evaluering av denne modellen på testsettet.
Note
Les mer

Det tredje steget innebærer vanligvis å teste flere algoritmer og justere deres hyperparametre for å identifisere det beste alternativet. For enkelhets skyld ble kun én algoritme brukt i dette kurset.

Før du går videre til den siste utfordringen, er det viktig å merke seg at kryssvalidering ikke er den eneste metoden for å finjustere modeller. Etter hvert som datasett blir større, tar det mer tid å beregne kryssvalideringsscore, og det vanlige trenings-/test-splittet gir mer stabilitet på grunn av den økte størrelsen på testsettet.

Derfor deles store datasett ofte inn i tre sett: et treningssett, et valideringssett og et testsett. Modellen trenes på treningssettet og evalueres på valideringssettet for å velge modellen eller hyperparametrene som presterer best.

Dette valget bruker valideringssettets score i stedet for kryssvalideringsscore. Til slutt vurderes den valgte modellen på testsettet, som består av helt ukjente data, for å verifisere ytelsen.

Pingvindatasettet er lite, med kun 342 forekomster. På grunn av denne begrensede størrelsen vil kryssvalideringsscore bli brukt til evaluering i neste kapittel.

question mark

Hvorfor er kryssvalidering spesielt verdifullt for hyperparametertuning i mindre datasett, i motsetning til større datasett hvor trenings- og testdeling ofte foretrekkes?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 9
some-alt