Utfordring: Predikere Priser ved Bruk av Polynomisk Regresjon
I denne utfordringen skal du bygge den samme polynomregresjonen av grad 2 som i forrige utfordring. Du må imidlertid dele datasettet i et treningssett og et testsett for å beregne RMSE for begge disse settene. Dette er nødvendig for å vurdere om modellen overtilpasser eller undertilpasser.
Her er en påminnelse om funksjonen train_test_split() som du bør bruke.
Og her er en påminnelse om funksjonen mean_squared_error() som trengs for å beregne RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Tildel DataFrame med én kolonne
'age'fradftil variabelenX. - Forhåndsprosesser
Xved å bruke klassenPolynomialFeatures. - Del datasettet ved hjelp av riktig funksjon fra
sklearn. - Bygg og tren en modell på treningssettet.
- Prediker målene for både trenings- og testsett.
- Beregn RMSE for både trenings- og testsett.
- Skriv ut oppsummeringstabellen.
Løsning
Når du har fullført oppgaven, vil du legge merke til at test-RMSE faktisk er lavere enn trenings-RMSE. Vanligvis gir ikke modeller bedre resultater på ukjente data. Her er forskjellen svært liten og skyldes tilfeldigheter. Datasettet vårt er relativt lite, og ved delingen fikk testsettet litt bedre (enklere å forutsi) datapunkter.
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 5.26
Utfordring: Predikere Priser ved Bruk av Polynomisk Regresjon
Sveip for å vise menyen
I denne utfordringen skal du bygge den samme polynomregresjonen av grad 2 som i forrige utfordring. Du må imidlertid dele datasettet i et treningssett og et testsett for å beregne RMSE for begge disse settene. Dette er nødvendig for å vurdere om modellen overtilpasser eller undertilpasser.
Her er en påminnelse om funksjonen train_test_split() som du bør bruke.
Og her er en påminnelse om funksjonen mean_squared_error() som trengs for å beregne RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Tildel DataFrame med én kolonne
'age'fradftil variabelenX. - Forhåndsprosesser
Xved å bruke klassenPolynomialFeatures. - Del datasettet ved hjelp av riktig funksjon fra
sklearn. - Bygg og tren en modell på treningssettet.
- Prediker målene for både trenings- og testsett.
- Beregn RMSE for både trenings- og testsett.
- Skriv ut oppsummeringstabellen.
Løsning
Når du har fullført oppgaven, vil du legge merke til at test-RMSE faktisk er lavere enn trenings-RMSE. Vanligvis gir ikke modeller bedre resultater på ukjente data. Her er forskjellen svært liten og skyldes tilfeldigheter. Datasettet vårt er relativt lite, og ved delingen fikk testsettet litt bedre (enklere å forutsi) datapunkter.
Takk for tilbakemeldingene dine!
single