Haaste: Hintojen Ennustaminen Polynomiregressiolla
Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa aineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta voidaan laskea RMSE molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Tässä muistutuksena train_test_split()-funktion käyttö.
Lisäksi muistutus mean_squared_error()-funktion ja np.sqrt()-funktion käytöstä RMSE:n laskemiseen:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Määritä muuttujaan
'age'DataFrame, jossa on vain yksi sarakedfX:stä. - Esikäsittele
XkäyttämälläPolynomialFeatures-luokkaa. - Jaa aineisto sopivalla
sklearn-funktiolla. - Rakenna ja kouluta malli harjoitusaineistolla.
- Ennusta sekä harjoitus- että testiaineiston kohdemuuttujat.
- Laske RMSE molemmille aineistoille.
- Tulosta yhteenvetotaulukko.
Ratkaisu
Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jakaessa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 5.26
Haaste: Hintojen Ennustaminen Polynomiregressiolla
Pyyhkäise näyttääksesi valikon
Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa aineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta voidaan laskea RMSE molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Tässä muistutuksena train_test_split()-funktion käyttö.
Lisäksi muistutus mean_squared_error()-funktion ja np.sqrt()-funktion käytöstä RMSE:n laskemiseen:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Määritä muuttujaan
'age'DataFrame, jossa on vain yksi sarakedfX:stä. - Esikäsittele
XkäyttämälläPolynomialFeatures-luokkaa. - Jaa aineisto sopivalla
sklearn-funktiolla. - Rakenna ja kouluta malli harjoitusaineistolla.
- Ennusta sekä harjoitus- että testiaineiston kohdemuuttujat.
- Laske RMSE molemmille aineistoille.
- Tulosta yhteenvetotaulukko.
Ratkaisu
Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jakaessa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.
Kiitos palautteestasi!
single