Зміст курсу
Метод Головних Компонент
Метод Головних Компонент
Вступ
Метод головних компонент (Principal Component Analysis - PCA) - один з найвідоміших алгоритмів обробки даних. Іноді він використовується лише як етап обробки даних, після якого отримані дані використовуються в алгоритмах машинного навчання. В інших випадках PCA використовується як основний метод для вирішення практичних завдань.
PCA - це метод машинного навчання без вчителя. Для того, щоб почати його використовувати, достатньо мати набір даних.
Що насправді вміє PCA? Це алгоритм, який дозволяє зменшити розмірність даних. Припустимо, у нас є дані зі 125 ознаками, і ми хочемо створити модель машинного навчання, яка буде класифікувати ці дані. Якщо в наборі даних більше 500 000 записів, то навчання може зайняти занадто багато часу і забрати багато обчислювальних ресурсів. Яким буде рішення? Використання методу головних компонент, який дозволяє зменшити розмірність характеристик, наприклад, до 50.
У цьому курсі ми розглядаємо лише алгоритм PCA, але існує багато інших підходів до зменшення розмірності даних.
Дякуємо за ваш відгук!