Типи Даних
Кожен стовпець (ознака) у навчальній вибірці має пов'язаний з ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату і(або) час.
Більшість алгоритмів машинного навчання працюють добре лише з числовими даними, тому категоріальні та часові значення потрібно перетворювати у числа.
Для дати та часу можна виділити ознаки, такі як 'year'
, 'month'
та подібні, залежно від завдання. Вони вже є числовими значеннями, тому їх можна використовувати безпосередньо.
З категоріальними даними працювати дещо складніше.
Типи категоріальних даних
Категоріальні дані поділяються на два типи:
-
Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;
-
Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.
Перетворення порядкових і номінативних типів даних у числові значення потребує різних підходів, тому їх слід обробляти окремо.
Існують кращі способи перетворення дат у числові значення, які виходять за межі цього вступного курсу. Наприклад, якщо використовувати лише ознаку 'month'
, це не враховує, що 12-й місяць насправді ближчий до 1-го, ніж до 9-го.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain how to convert ordinal data into numerical values?
What are the common methods for encoding nominal data?
Why do machine learning algorithms require numerical data?
Awesome!
Completion rate improved to 3.13
Типи Даних
Свайпніть щоб показати меню
Кожен стовпець (ознака) у навчальній вибірці має пов'язаний з ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату і(або) час.
Більшість алгоритмів машинного навчання працюють добре лише з числовими даними, тому категоріальні та часові значення потрібно перетворювати у числа.
Для дати та часу можна виділити ознаки, такі як 'year'
, 'month'
та подібні, залежно від завдання. Вони вже є числовими значеннями, тому їх можна використовувати безпосередньо.
З категоріальними даними працювати дещо складніше.
Типи категоріальних даних
Категоріальні дані поділяються на два типи:
-
Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;
-
Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.
Перетворення порядкових і номінативних типів даних у числові значення потребує різних підходів, тому їх слід обробляти окремо.
Існують кращі способи перетворення дат у числові значення, які виходять за межі цього вступного курсу. Наприклад, якщо використовувати лише ознаку 'month'
, це не враховує, що 12-й місяць насправді ближчий до 1-го, ніж до 9-го.
Дякуємо за ваш відгук!