Знаходження Параметрів
Тепер відомо, що лінійна регресія — це просто пряма, яка найкраще описує дані. Але як визначити, яка саме пряма є правильною?
Можна обчислити різницю між передбаченим значенням і фактичним цільовим значенням для кожної точки даних у навчальній вибірці.
Ці різниці називаються залишками (або помилками). Мета полягає в тому, щоб залишки були якомога меншими.
Метод найменших квадратів
Стандартний підхід — це метод найменших квадратів (OLS):
Для кожного залишку потрібно піднести його до квадрату (переважно для усунення знаку залишку) і підсумувати всі ці значення.
Це називається SSR (сума квадратів залишків). Завдання полягає у знаходженні параметрів, які мінімізують SSR.
Нормальне рівняння
На щастя, нам не потрібно перебирати всі прямі та обчислювати для них SSR. Задача мінімізації SSR має математичне рішення, яке не є дуже обчислювально затратним.
Це рішення називається нормальне рівняння.
Це рівняння дає нам параметри прямої з найменшим SSR.
Не зрозуміли, як це працює? Не хвилюйтеся! Це досить складна математика. Але вам не потрібно обчислювати параметри вручну. Багато бібліотек вже реалізували лінійну регресію.
Тест
1. Розгляньте зображення вище. Яка регресійна пряма є кращою?
2. y_true - y_predicted
називається
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain what the Normal Equation is in simpler terms?
What is the difference between residuals and SSR?
Why do we square the residuals in the OLS method?
Awesome!
Completion rate improved to 5.26
Знаходження Параметрів
Свайпніть щоб показати меню
Тепер відомо, що лінійна регресія — це просто пряма, яка найкраще описує дані. Але як визначити, яка саме пряма є правильною?
Можна обчислити різницю між передбаченим значенням і фактичним цільовим значенням для кожної точки даних у навчальній вибірці.
Ці різниці називаються залишками (або помилками). Мета полягає в тому, щоб залишки були якомога меншими.
Метод найменших квадратів
Стандартний підхід — це метод найменших квадратів (OLS):
Для кожного залишку потрібно піднести його до квадрату (переважно для усунення знаку залишку) і підсумувати всі ці значення.
Це називається SSR (сума квадратів залишків). Завдання полягає у знаходженні параметрів, які мінімізують SSR.
Нормальне рівняння
На щастя, нам не потрібно перебирати всі прямі та обчислювати для них SSR. Задача мінімізації SSR має математичне рішення, яке не є дуже обчислювально затратним.
Це рішення називається нормальне рівняння.
Це рівняння дає нам параметри прямої з найменшим SSR.
Не зрозуміли, як це працює? Не хвилюйтеся! Це досить складна математика. Але вам не потрібно обчислювати параметри вручну. Багато бібліотек вже реалізували лінійну регресію.
Тест
1. Розгляньте зображення вище. Яка регресійна пряма є кращою?
2. y_true - y_predicted
називається
Дякуємо за ваш відгук!