Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Типи Даних | Концепції Машинного Навчання
Вступ до ML з Scikit-learn

bookТипи Даних

Кожен стовпець (ознака) у навчальній вибірці має пов'язаний з ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату і(або) час.

Більшість алгоритмів машинного навчання працюють добре лише з числовими даними, тому категоріальні та часові значення потрібно перетворювати у числа.

Для дати та часу можна виділити ознаки, такі як 'year', 'month' та подібні, залежно від завдання. Вони вже є числовими значеннями, тому їх можна використовувати безпосередньо.

З категоріальними даними працювати дещо складніше.

Типи категоріальних даних

Категоріальні дані поділяються на два типи:

  • Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;

  • Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.

Перетворення порядкових і номінативних типів даних у числові значення потребує різних підходів, тому їх слід обробляти окремо.

Note
Додаткове вивчення

Існують кращі способи перетворення дат у числові значення, які виходять за межі цього вступного курсу. Наприклад, якщо використовувати лише ознаку 'month', це не враховує, що 12-й місяць насправді ближчий до 1-го, ніж до 9-го.

question-icon

Відповідність між ознакою та її типом даних.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Натисніть або перетягніть елементи та заповніть пропуски

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 4

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain how to convert ordinal data into numerical values?

What are the common methods for encoding nominal data?

Why do machine learning algorithms require numerical data?

Awesome!

Completion rate improved to 3.13

bookТипи Даних

Свайпніть щоб показати меню

Кожен стовпець (ознака) у навчальній вибірці має пов'язаний з ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату і(або) час.

Більшість алгоритмів машинного навчання працюють добре лише з числовими даними, тому категоріальні та часові значення потрібно перетворювати у числа.

Для дати та часу можна виділити ознаки, такі як 'year', 'month' та подібні, залежно від завдання. Вони вже є числовими значеннями, тому їх можна використовувати безпосередньо.

З категоріальними даними працювати дещо складніше.

Типи категоріальних даних

Категоріальні дані поділяються на два типи:

  • Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;

  • Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.

Перетворення порядкових і номінативних типів даних у числові значення потребує різних підходів, тому їх слід обробляти окремо.

Note
Додаткове вивчення

Існують кращі способи перетворення дат у числові значення, які виходять за межі цього вступного курсу. Наприклад, якщо використовувати лише ознаку 'month', це не враховує, що 12-й місяць насправді ближчий до 1-го, ніж до 9-го.

question-icon

Відповідність між ознакою та її типом даних.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Натисніть або перетягніть елементи та заповніть пропуски

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 4
some-alt