Навчальна Вибірка
У задачах з навчанням з учителем або без учителя, навчальний набір зазвичай подається у табличному форматі.
Прикладом є набір даних про діабет, який використовується для прогнозування наявності діабету у людини. Він містить записи про 768 жінок із такими параметрами, як вік, індекс маси тіла та артеріальний тиск. Ці параметри називаються ознаками.
У наборі також є стовпець 'Outcome'
, який вказує, чи є у людини діабет. Це цільова змінна.
Кожен рядок у таблиці — це екземпляр (також називається точкою даних або вибіркою), що представляє інформацію про одну особу.
Таблиця (навчальний набір) містить цільовий стовпець, тобто вона має мітки.
Завдання полягає у навчанні ML-моделі на цьому навчальному наборі, і після навчання вона зможе прогнозувати для інших людей (нових екземплярів), чи є у них діабет, використовуючи лише ознаки.
Цей навчальний набір є прикладом упередженого набору даних, оскільки містить інформацію виключно про жінок віком від 21 року. Тому модель може давати менш точні прогнози для чоловіків або для жінок молодших за 21 рік, оскільки вона не навчалася на цих групах.
Під час кодування стовпці ознак зазвичай призначаються змінній X
, а стовпці цільової змінної — як y
.
Ознаки нових екземплярів призначаються як X_new
.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.13
Навчальна Вибірка
Свайпніть щоб показати меню
У задачах з навчанням з учителем або без учителя, навчальний набір зазвичай подається у табличному форматі.
Прикладом є набір даних про діабет, який використовується для прогнозування наявності діабету у людини. Він містить записи про 768 жінок із такими параметрами, як вік, індекс маси тіла та артеріальний тиск. Ці параметри називаються ознаками.
У наборі також є стовпець 'Outcome'
, який вказує, чи є у людини діабет. Це цільова змінна.
Кожен рядок у таблиці — це екземпляр (також називається точкою даних або вибіркою), що представляє інформацію про одну особу.
Таблиця (навчальний набір) містить цільовий стовпець, тобто вона має мітки.
Завдання полягає у навчанні ML-моделі на цьому навчальному наборі, і після навчання вона зможе прогнозувати для інших людей (нових екземплярів), чи є у них діабет, використовуючи лише ознаки.
Цей навчальний набір є прикладом упередженого набору даних, оскільки містить інформацію виключно про жінок віком від 21 року. Тому модель може давати менш точні прогнози для чоловіків або для жінок молодших за 21 рік, оскільки вона не навчалася на цих групах.
Під час кодування стовпці ознак зазвичай призначаються змінній X
, а стовпці цільової змінної — як y
.
Ознаки нових екземплярів призначаються як X_new
.
Дякуємо за ваш відгук!