Зміст курсу
Метод Головних Компонент
Метод Головних Компонент
Математична ідея
PCA ефективно вирішує проблему стиснення даних з найменшими втратами. Спробуємо уявити, як це відбувається математично.
Якщо у нас є зображення, які ми хочемо "стиснути", логічно залишити найбільш важливі та яскраво виражені частини зображення, а деталі можна видалити.
Алгоритм PCA працює так само. Він об'єднує найбільш корельовані змінні в нові змінні (компоненти). Але тут є важлива деталь! Компоненти між собою повинні мати найменшу кореляцію для важливості даних.
Математично цю проблему можна назвати проблемою максимізації дисперсії між точками даних. Таким чином формуються головні компоненти, які створює алгоритм PCA.
Перший компонент "утримує" найбільшу кількість даних, тоді як другий, третій і наступні - все менше і менше.
У другому розділі ми детальніше розглянемо кожен крок на шляху до отримання головних компонент.
Тест
Ми вирішили використати PCA для перетворення даних з двовимірного простору в одномірний.
Дякуємо за ваш відгук!