Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split(), яку слід використати.
А також нагадування про функцію mean_squared_error() разом із np.sqrt() для обчислення RMSE:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Призначте DataFrame з єдиною колонкою
'age'зdfзміннійX. - Передобробіть
Xза допомогою класуPolynomialFeatures. - Розділіть набір даних за допомогою відповідної функції з
sklearn. - Побудуйте та навчіть модель на тренувальному наборі.
- Передбачте цільові значення як для тренувального, так і для тестового набору.
- Обчисліть RMSE для тренувального та тестового наборів.
- Виведіть підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше за тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних досить малий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) дані.
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain how to use the train_test_split function in this context?
What is the formula for calculating RMSE, and why is it important?
How can I interpret the difference between training and test RMSE values?
Awesome!
Completion rate improved to 5.26
Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
Свайпніть щоб показати меню
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split(), яку слід використати.
А також нагадування про функцію mean_squared_error() разом із np.sqrt() для обчислення RMSE:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Призначте DataFrame з єдиною колонкою
'age'зdfзміннійX. - Передобробіть
Xза допомогою класуPolynomialFeatures. - Розділіть набір даних за допомогою відповідної функції з
sklearn. - Побудуйте та навчіть модель на тренувальному наборі.
- Передбачте цільові значення як для тренувального, так і для тестового набору.
- Обчисліть RMSE для тренувального та тестового наборів.
- Виведіть підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше за тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних досить малий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) дані.
Дякуємо за ваш відгук!
single