Вивчайте Навчальна Вибірка | Концепції Машинного Навчання

У задачах з навчанням з учителем або без учителя навчальна вибірка зазвичай подається у табличному форматі.

Прикладом є набір даних про діабет, який використовується для прогнозування наявності діабету у людини. Він містить записи про 768 жінок із такими параметрами, як вік, індекс маси тіла та артеріальний тиск. Ці параметри називаються ознаками.

У наборі даних також є стовпець 'Outcome', який вказує, чи є у людини діабет. Це цільова змінна.

Кожен рядок у таблиці — це екземпляр (також називається точкою даних або зразком), що представляє інформацію про одну особу.

Таблиця (навчальна вибірка) містить цільовий стовпець, тобто вона є розміченою.

Завдання полягає у навчанні ML-моделі на цій навчальній вибірці, і після навчання вона зможе прогнозувати для інших людей (нових екземплярів) наявність діабету лише за ознаками.

Примітка

Ця навчальна вибірка є прикладом упередженого набору даних, оскільки містить інформацію виключно про жінок віком від 21 року. Тому модель може давати менш точні прогнози для чоловіків або для жінок молодше 21 року, оскільки вона не навчалася на цих групах.

Під час кодування стовпці ознак зазвичай призначаються змінній X, а стовпці цільових значень — змінній y.

Ознаки нових екземплярів призначаються як X_new.

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 1. Розділ 3

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Свайпніть щоб показати меню