Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії | Вибір Найкращої Моделі
Лінійна регресія з Python

bookЗавдання: Прогнозування Цін за Допомогою Поліноміальної Регресії

У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split(), яку слід використати.

А також нагадування про функцію mean_squared_error() разом із np.sqrt() для обчислення RMSE:

rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Завдання

Swipe to start coding

  1. Призначте DataFrame з єдиною колонкою 'age' з df змінній X.
  2. Передобробіть X за допомогою класу PolynomialFeatures.
  3. Розділіть набір даних за допомогою відповідної функції з sklearn.
  4. Побудуйте та навчіть модель на тренувальному наборі.
  5. Передбачте цільові значення як для тренувального, так і для тестового набору.
  6. Обчисліть RMSE для тренувального та тестового наборів.
  7. Виведіть підсумкову таблицю.

Рішення

Після виконання завдання ви помітите, що тестове RMSE навіть менше за тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних досить малий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) дані.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 4
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain how to use the train_test_split function in this context?

What is the formula for calculating RMSE, and why is it important?

How can I interpret the difference between training and test RMSE values?

close

Awesome!

Completion rate improved to 5.26

bookЗавдання: Прогнозування Цін за Допомогою Поліноміальної Регресії

Свайпніть щоб показати меню

У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split(), яку слід використати.

А також нагадування про функцію mean_squared_error() разом із np.sqrt() для обчислення RMSE:

rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Завдання

Swipe to start coding

  1. Призначте DataFrame з єдиною колонкою 'age' з df змінній X.
  2. Передобробіть X за допомогою класу PolynomialFeatures.
  3. Розділіть набір даних за допомогою відповідної функції з sklearn.
  4. Побудуйте та навчіть модель на тренувальному наборі.
  5. Передбачте цільові значення як для тренувального, так і для тестового набору.
  6. Обчисліть RMSE для тренувального та тестового наборів.
  7. Виведіть підсумкову таблицю.

Рішення

Після виконання завдання ви помітите, що тестове RMSE навіть менше за тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних досить малий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) дані.

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 4
single

single

some-alt