Зміст курсу
Метод Головних Компонент
Метод Головних Компонент
Як пояснити отримані результати?
Наступним важливим кроком після застосування алгоритму PCA є пояснення результатів.
Ми можемо дослідити кореляцію між кожним головним компонентом і змінною. Цей зв'язок називається факторним навантаженням. Ця статистика полегшує розуміння основного виміру компонента.
Ми використовуємо результати, отримані в попередньому розділі.
C1
, C2
і C3
- це основні компоненти, які виводить модель PCA. Вісь Y містить назви стовпців з набору даних. Як бачимо, перша головна компонента найбільше корелює з SalePrice
, OveralQual
та GarageArea
. Припустимо, що це основні змінні, які визначають вартість будинку.
Друга компонента в основному відповідає за показники BedroomAbvGr
і KitchenAbvGr
- кількість спалень або кухонь, основних приміщень у будинку.
Третя компонента не здається такою очевидною, як попередні 2. Вона має найбільш виражену змінну LotArea
та MSSubClass
з від'ємною кореляцією.
Факторне навантаження є одним з основних методів, який дозволяє дослідити компоненти, що утворили PCA. Далі ми розглянемо інші методи.
Тест
Результат PCA на наборі даних з рейтингом різних місць (будівель) у місті представлено в таблиці нижче.
Дякуємо за ваш відгук!