Gridsearchcv
Om de modelprestaties te verbeteren, worden hyperparameters afgestemd. Het idee is eenvoudig: verschillende waarden testen, kruisvalidatiescores berekenen en de waarde met de hoogste score kiezen.
Dit proces kan worden uitgevoerd met de GridSearchCV-klasse uit de module sklearn.model_selection.
GridSearchCV vereist een model en een parameterrooster (param_grid).
Voorbeeld:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Na het initialiseren van GridSearchCV, .fit(X, y) aanroepen.
- Het beste model bevindt zich in
.best_estimator_; - De kruisvalidatiescore staat in
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Na het trainen past GridSearchCV automatisch de beste estimator opnieuw toe op de volledige dataset.
Het grid_search-object wordt het uiteindelijke getrainde model en kan direct worden gebruikt met .predict() en .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 3.13
Gridsearchcv
Veeg om het menu te tonen
Om de modelprestaties te verbeteren, worden hyperparameters afgestemd. Het idee is eenvoudig: verschillende waarden testen, kruisvalidatiescores berekenen en de waarde met de hoogste score kiezen.
Dit proces kan worden uitgevoerd met de GridSearchCV-klasse uit de module sklearn.model_selection.
GridSearchCV vereist een model en een parameterrooster (param_grid).
Voorbeeld:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Na het initialiseren van GridSearchCV, .fit(X, y) aanroepen.
- Het beste model bevindt zich in
.best_estimator_; - De kruisvalidatiescore staat in
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Na het trainen past GridSearchCV automatisch de beste estimator opnieuw toe op de volledige dataset.
Het grid_search-object wordt het uiteindelijke getrainde model en kan direct worden gebruikt met .predict() en .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Bedankt voor je feedback!