Вивчайте Робочий процес машинного навчання | Концепції Машинного Навчання

Розглянемо робочий процес, який необхідно пройти для створення успішного проєкту машинного навчання.

Крок 1. Отримання даних

Визначення задачі, вибір метрики ефективності та встановлення критеріїв для хорошого результату. Далі — збір необхідних даних із доступних джерел та приведення їх до формату, придатного для використання в Python. Якщо дані вже збережені у CSV-файлі, можна одразу переходити до попередньої обробки.

Приклад

Лікарня збирає записи пацієнтів та демографічні дані у CSV-файл. Мета — прогнозування повторних госпіталізацій з точністю понад 80%.

Крок 2. Попередня обробка даних

Цей етап включає:

Очищення даних: обробка пропущених значень і нечислових даних;
EDA: аналіз і візуалізація даних для виявлення зв'язків і проблем;
Фічерінженерія: вибір або створення ознак, що підвищують ефективність моделі.

Приклад

Пропущені значення (наприклад, артеріальний тиск) заповнюються, а категоріальні ознаки (наприклад, раса) перетворюються у числовий формат.

Крок 3. Моделювання

Цей етап включає:

Вибір моделі залежно від типу задачі та експериментів;
Налаштування гіперпараметрів для підвищення ефективності;
Оцінювання моделі на невідомих даних.

Дізнатися більше

Гіперпараметри — це налаштовувані параметри, які визначають процес навчання моделі, наприклад, тривалість навчання або складність моделі.

Приклад

Для прогнозування повторної госпіталізації (так/ні) обирається модель класифікації. Після налаштування вона оцінюється на валідаційній/тестовій вибірці для перевірки здатності до узагальнення.

Крок 4. Розгортання

Після досягнення належної якості модель розгортається у реальних системах. Необхідно здійснювати моніторинг моделі, оновлювати її новими даними та вдосконалювати з часом, часто починаючи цикл з Кроку 1.

Приклад

Модель інтегрується в систему лікарні для виявлення пацієнтів з високим ризиком під час госпіталізації, що допомагає персоналу діяти завчасно.

Примітка

Деякі з термінів, згаданих тут, можуть здатися незнайомими, але ми розглянемо їх детальніше пізніше у цьому курсі.

Попередню обробку даних і моделювання можна виконувати за допомогою scikit-learn. У наступних розділах буде представлено робочі процеси попередньої обробки та конвеєри, а також моделювання із застосуванням методу найближчих сусідів (KNeighborsClassifier), включаючи навчання, налаштування та оцінювання.

1. Яка основна мета етапу "Отримання даних" у проєкті машинного навчання?

2. Яке з наведеного найкраще описує важливість етапу "Попередня обробка даних" у робочому процесі проєкту машинного навчання?

Яке з наведеного найкраще описує важливість етапу "Попередня обробка даних" у робочому процесі проєкту машинного навчання?

Select the correct answer

Він полягає лише у видаленні дублікатів із даних.

Цей етап є необов'язковим і може бути пропущений, якщо дані вже мають числовий формат.

Включає очищення даних, проведення розвідувального аналізу даних та створення ознак для підготовки до моделювання.

Це виключно перетворення всіх текстових даних у числові коди.

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 1. Розділ 5

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain more about data preprocessing steps?

What is feature engineering and why is it important?

How does KNeighborsClassifier work in machine learning?

Свайпніть щоб показати меню

Розглянемо робочий процес, який необхідно пройти для створення успішного проєкту машинного навчання.

Крок 1. Отримання даних

Приклад

Крок 2. Попередня обробка даних

Цей етап включає:

Очищення даних: обробка пропущених значень і нечислових даних;
EDA: аналіз і візуалізація даних для виявлення зв'язків і проблем;
Фічерінженерія: вибір або створення ознак, що підвищують ефективність моделі.

Приклад

Крок 3. Моделювання

Цей етап включає:

Вибір моделі залежно від типу задачі та експериментів;
Налаштування гіперпараметрів для підвищення ефективності;
Оцінювання моделі на невідомих даних.

Дізнатися більше

Приклад

Крок 4. Розгортання

Приклад

Примітка

1. Яка основна мета етапу "Отримання даних" у проєкті машинного навчання?

2. Яке з наведеного найкраще описує важливість етапу "Попередня обробка даних" у робочому процесі проєкту машинного навчання?

Select the correct answer

Він полягає лише у видаленні дублікатів із даних.

Цей етап є необов'язковим і може бути пропущений, якщо дані вже мають числовий формат.

Це виключно перетворення всіх текстових даних у числові коди.

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 1. Розділ 5