Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Predikere Priser ved Bruk av Polynomisk Regresjon | Velge Den Beste Modellen
Lineær Regresjon med Python

bookUtfordring: Predikere Priser ved Bruk av Polynomisk Regresjon

I denne utfordringen skal du bygge den samme polynomregresjonen av grad 2 som i forrige utfordring. Du må imidlertid dele datasettet i et treningssett og et testsett for å beregne RMSE for begge disse settene. Dette er nødvendig for å vurdere om modellen overtilpasser eller undertilpasser.
Her er en påminnelse om funksjonen train_test_split() som du bør bruke.

Og her er en påminnelse om funksjonen mean_squared_error() som trengs for å beregne RMSE:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Oppgave

Swipe to start coding

  1. Tildel DataFrame med én kolonne 'age' fra df til variabelen X.
  2. Forhåndsprosesser X ved å bruke klassen PolynomialFeatures.
  3. Del datasettet ved hjelp av riktig funksjon fra sklearn.
  4. Bygg og tren en modell på treningssettet.
  5. Prediker målene for både trenings- og testsett.
  6. Beregn RMSE for både trenings- og testsett.
  7. Skriv ut oppsummeringstabellen.

Løsning

Når du har fullført oppgaven, vil du legge merke til at test-RMSE faktisk er lavere enn trenings-RMSE. Vanligvis gir ikke modeller bedre resultater på ukjente data. Her er forskjellen svært liten og skyldes tilfeldigheter. Datasettet vårt er relativt lite, og ved delingen fikk testsettet litt bedre (enklere å forutsi) datapunkter.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 4
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 5.26

bookUtfordring: Predikere Priser ved Bruk av Polynomisk Regresjon

Sveip for å vise menyen

I denne utfordringen skal du bygge den samme polynomregresjonen av grad 2 som i forrige utfordring. Du må imidlertid dele datasettet i et treningssett og et testsett for å beregne RMSE for begge disse settene. Dette er nødvendig for å vurdere om modellen overtilpasser eller undertilpasser.
Her er en påminnelse om funksjonen train_test_split() som du bør bruke.

Og her er en påminnelse om funksjonen mean_squared_error() som trengs for å beregne RMSE:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Oppgave

Swipe to start coding

  1. Tildel DataFrame med én kolonne 'age' fra df til variabelen X.
  2. Forhåndsprosesser X ved å bruke klassen PolynomialFeatures.
  3. Del datasettet ved hjelp av riktig funksjon fra sklearn.
  4. Bygg og tren en modell på treningssettet.
  5. Prediker målene for både trenings- og testsett.
  6. Beregn RMSE for både trenings- og testsett.
  7. Skriv ut oppsummeringstabellen.

Løsning

Når du har fullført oppgaven, vil du legge merke til at test-RMSE faktisk er lavere enn trenings-RMSE. Vanligvis gir ikke modeller bedre resultater på ukjente data. Her er forskjellen svært liten og skyldes tilfeldigheter. Datasettet vårt er relativt lite, og ved delingen fikk testsettet litt bedre (enklere å forutsi) datapunkter.

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 4
single

single

some-alt