Gridsearchcv
Mallin suorituskyvyn parantamiseksi säädetään hyperparametreja. Ajatus on yksinkertainen: testataan eri arvoja, lasketaan ristiinvalidointipisteet ja valitaan se, jolla on korkein pistemäärä.
Tämä prosessi voidaan toteuttaa käyttämällä GridSearchCV-luokkaa, joka löytyy sklearn.model_selection -moduulista.
GridSearchCV vaatii mallin ja parametriverkon (param_grid).
Esimerkki:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Kun GridSearchCV on alustettu, kutsutaan .fit(X, y).
- Paras malli löytyy kentästä
.best_estimator_; - Sen ristiinvalidointipisteet löytyvät kentästä
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Sovituksen jälkeen GridSearchCV kouluttaa automaattisesti parhaan estimaattorin koko aineistolla.
grid_search-objekti toimii lopullisena koulutettuna mallina ja sitä voidaan käyttää suoraan metodeilla .predict() ja .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 3.13
Gridsearchcv
Pyyhkäise näyttääksesi valikon
Mallin suorituskyvyn parantamiseksi säädetään hyperparametreja. Ajatus on yksinkertainen: testataan eri arvoja, lasketaan ristiinvalidointipisteet ja valitaan se, jolla on korkein pistemäärä.
Tämä prosessi voidaan toteuttaa käyttämällä GridSearchCV-luokkaa, joka löytyy sklearn.model_selection -moduulista.
GridSearchCV vaatii mallin ja parametriverkon (param_grid).
Esimerkki:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Kun GridSearchCV on alustettu, kutsutaan .fit(X, y).
- Paras malli löytyy kentästä
.best_estimator_; - Sen ristiinvalidointipisteet löytyvät kentästä
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Sovituksen jälkeen GridSearchCV kouluttaa automaattisesti parhaan estimaattorin koko aineistolla.
grid_search-objekti toimii lopullisena koulutettuna mallina ja sitä voidaan käyttää suoraan metodeilla .predict() ja .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Kiitos palautteestasi!