Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Het Beste K-Waarde Kiezen | K-NN-Classificator
Classificatie met Python

bookUitdaging: Het Beste K-Waarde Kiezen

Zoals getoond in de vorige hoofdstukken, kunnen de voorspellingen van het model variëren afhankelijk van de waarde van k (het aantal buren). Bij het bouwen van een k-NN-model is het belangrijk om de k-waarde te kiezen die de beste prestaties oplevert.

Een gangbare aanpak is het gebruik van cross-validatie om de modelprestaties te evalueren. U kunt een lus uitvoeren en cross-validatiescores voor een reeks k-waarden berekenen, en vervolgens de waarde met de hoogste score selecteren. Dit is de meest gebruikte methode.

Om dit uit te voeren biedt sklearn een handig hulpmiddel: de GridSearchCV-klasse.

De parameter param_grid accepteert een dictionary waarbij de sleutels parameternamen zijn en de waarden lijsten met opties om te proberen. Om bijvoorbeeld waarden van 1 tot 99 voor n_neighbors te testen, kunt u schrijven:

param_grid = {'n_neighbors': range(1, 100)}

Door de .fit(X, y)-methode aan te roepen op het GridSearchCV-object, wordt het parameterrooster doorzocht om de beste parameters te vinden en vervolgens wordt het model opnieuw getraind op de volledige dataset met deze beste parameters.

U kunt de beste score opvragen met het attribuut .best_score_ en voorspellingen doen met het geoptimaliseerde model via de .predict()-methode. Op dezelfde manier kunt u het beste model zelf ophalen met het attribuut .best_estimator_.

Taak

Swipe to start coding

Je krijgt de Star Wars-beoordelingsdataset, opgeslagen als een DataFrame in de variabele df.

  • Initialiseer param_grid als een woordenboek met de parameter n_neighbors en de waarden [3, 9, 18, 27].
  • Maak een GridSearchCV-object aan met behulp van param_grid met 4-voudige crossvalidatie, train dit object en sla het op in de variabele grid_search.
  • Haal het beste model op uit grid_search en sla dit op in de variabele best_model.
  • Haal de score van het beste model op en sla deze op in de variabele best_score.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 7
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 4.17

bookUitdaging: Het Beste K-Waarde Kiezen

Veeg om het menu te tonen

Zoals getoond in de vorige hoofdstukken, kunnen de voorspellingen van het model variëren afhankelijk van de waarde van k (het aantal buren). Bij het bouwen van een k-NN-model is het belangrijk om de k-waarde te kiezen die de beste prestaties oplevert.

Een gangbare aanpak is het gebruik van cross-validatie om de modelprestaties te evalueren. U kunt een lus uitvoeren en cross-validatiescores voor een reeks k-waarden berekenen, en vervolgens de waarde met de hoogste score selecteren. Dit is de meest gebruikte methode.

Om dit uit te voeren biedt sklearn een handig hulpmiddel: de GridSearchCV-klasse.

De parameter param_grid accepteert een dictionary waarbij de sleutels parameternamen zijn en de waarden lijsten met opties om te proberen. Om bijvoorbeeld waarden van 1 tot 99 voor n_neighbors te testen, kunt u schrijven:

param_grid = {'n_neighbors': range(1, 100)}

Door de .fit(X, y)-methode aan te roepen op het GridSearchCV-object, wordt het parameterrooster doorzocht om de beste parameters te vinden en vervolgens wordt het model opnieuw getraind op de volledige dataset met deze beste parameters.

U kunt de beste score opvragen met het attribuut .best_score_ en voorspellingen doen met het geoptimaliseerde model via de .predict()-methode. Op dezelfde manier kunt u het beste model zelf ophalen met het attribuut .best_estimator_.

Taak

Swipe to start coding

Je krijgt de Star Wars-beoordelingsdataset, opgeslagen als een DataFrame in de variabele df.

  • Initialiseer param_grid als een woordenboek met de parameter n_neighbors en de waarden [3, 9, 18, 27].
  • Maak een GridSearchCV-object aan met behulp van param_grid met 4-voudige crossvalidatie, train dit object en sla het op in de variabele grid_search.
  • Haal het beste model op uit grid_search en sla dit op in de variabele best_model.
  • Haal de score van het beste model op en sla deze op in de variabele best_score.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 7
single

single

some-alt