Desafio: Previsão de Preços Usando Regressão Polinomial
Neste desafio, será necessário construir a mesma Regressão Polinomial de grau 2 do desafio anterior. No entanto, será preciso dividir o conjunto em um conjunto de treinamento e um conjunto de teste para calcular o RMSE para ambos. Isso é necessário para avaliar se o modelo está sofrendo overfitting ou underfitting.
Segue um lembrete da função train_test_split() que você deverá utilizar.
E também um lembrete da função mean_squared_error() necessária para calcular o RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Atribua o DataFrame com uma única coluna
'age'dedfà variávelX. - Pré-processe
Xutilizando a classePolynomialFeatures. - Divida o conjunto de dados utilizando a função apropriada do
sklearn. - Construa e treine um modelo no conjunto de treinamento.
- Realize previsões dos alvos tanto para o conjunto de treinamento quanto para o de teste.
- Calcule o RMSE para ambos os conjuntos, treinamento e teste.
- Imprima a tabela de resumo.
Solução
Ao concluir a tarefa, você notará que o RMSE do teste é ainda menor que o RMSE do treinamento. Normalmente, os modelos não apresentam resultados melhores em instâncias não vistas. Aqui, a diferença é pequena e causada pelo acaso. Nosso conjunto de dados é relativamente pequeno e, ao dividir, o conjunto de teste recebeu pontos de dados um pouco melhores (mais fáceis de prever).
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Can you explain how to interpret RMSE values for training and test sets?
What does it mean if the test RMSE is lower than the training RMSE?
Can you provide an example of how to use train_test_split and mean_squared_error together?
Awesome!
Completion rate improved to 5.26
Desafio: Previsão de Preços Usando Regressão Polinomial
Deslize para mostrar o menu
Neste desafio, será necessário construir a mesma Regressão Polinomial de grau 2 do desafio anterior. No entanto, será preciso dividir o conjunto em um conjunto de treinamento e um conjunto de teste para calcular o RMSE para ambos. Isso é necessário para avaliar se o modelo está sofrendo overfitting ou underfitting.
Segue um lembrete da função train_test_split() que você deverá utilizar.
E também um lembrete da função mean_squared_error() necessária para calcular o RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Atribua o DataFrame com uma única coluna
'age'dedfà variávelX. - Pré-processe
Xutilizando a classePolynomialFeatures. - Divida o conjunto de dados utilizando a função apropriada do
sklearn. - Construa e treine um modelo no conjunto de treinamento.
- Realize previsões dos alvos tanto para o conjunto de treinamento quanto para o de teste.
- Calcule o RMSE para ambos os conjuntos, treinamento e teste.
- Imprima a tabela de resumo.
Solução
Ao concluir a tarefa, você notará que o RMSE do teste é ainda menor que o RMSE do treinamento. Normalmente, os modelos não apresentam resultados melhores em instâncias não vistas. Aqui, a diferença é pequena e causada pelo acaso. Nosso conjunto de dados é relativamente pequeno e, ao dividir, o conjunto de teste recebeu pontos de dados um pouco melhores (mais fáceis de prever).
Obrigado pelo seu feedback!
single