Зміст курсу
Метод Головних Компонент
Метод Головних Компонент
Досліджуємо набір даних
Тепер ми детальніше розглянемо створення PCA моделі на прикладі одного набору даних. В якості набору даних ми використаємо wine
з набору scikit-learn
. Він містить 13 характеристик вина та 3 класи. Він особливо зручний для нас тим, що в ньому немає категоріальних змінних.
Завантажимо набір даних:
Тепер давайте дослідимо набір даних, щоб зрозуміти, з якими даними ми працюємо. Перетворимо numpy
масив X
у фрейм даних pandas
і перевіримо кількість відсутніх даних:
Щоб отримати повний опис кожного стовпчика (середнє значення, стандартне відхилення тощо), використовуйте метод .describe()
:
Перш ніж завантажити набір даних у модель PCA, давайте опрацюємо наші дані. Виходячи з попередніх уроків, ви могли помітити, що важливим кроком є стандартизація даних. Ми реалізуємо це за допомогою класу StandardScaler()
:
Завдання
Прочитати дані з файлу train.csv
(файл з Інтернету). Видалити стовпець "Id"
з набору даних та стандартизувати його.
Дякуємо за ваш відгук!
Досліджуємо набір даних
Тепер ми детальніше розглянемо створення PCA моделі на прикладі одного набору даних. В якості набору даних ми використаємо wine
з набору scikit-learn
. Він містить 13 характеристик вина та 3 класи. Він особливо зручний для нас тим, що в ньому немає категоріальних змінних.
Завантажимо набір даних:
Тепер давайте дослідимо набір даних, щоб зрозуміти, з якими даними ми працюємо. Перетворимо numpy
масив X
у фрейм даних pandas
і перевіримо кількість відсутніх даних:
Щоб отримати повний опис кожного стовпчика (середнє значення, стандартне відхилення тощо), використовуйте метод .describe()
:
Перш ніж завантажити набір даних у модель PCA, давайте опрацюємо наші дані. Виходячи з попередніх уроків, ви могли помітити, що важливим кроком є стандартизація даних. Ми реалізуємо це за допомогою класу StandardScaler()
:
Завдання
Прочитати дані з файлу train.csv
(файл з Інтернету). Видалити стовпець "Id"
з набору даних та стандартизувати його.
Дякуємо за ваш відгук!
Досліджуємо набір даних
Тепер ми детальніше розглянемо створення PCA моделі на прикладі одного набору даних. В якості набору даних ми використаємо wine
з набору scikit-learn
. Він містить 13 характеристик вина та 3 класи. Він особливо зручний для нас тим, що в ньому немає категоріальних змінних.
Завантажимо набір даних:
Тепер давайте дослідимо набір даних, щоб зрозуміти, з якими даними ми працюємо. Перетворимо numpy
масив X
у фрейм даних pandas
і перевіримо кількість відсутніх даних:
Щоб отримати повний опис кожного стовпчика (середнє значення, стандартне відхилення тощо), використовуйте метод .describe()
:
Перш ніж завантажити набір даних у модель PCA, давайте опрацюємо наші дані. Виходячи з попередніх уроків, ви могли помітити, що важливим кроком є стандартизація даних. Ми реалізуємо це за допомогою класу StandardScaler()
:
Завдання
Прочитати дані з файлу train.csv
(файл з Інтернету). Видалити стовпець "Id"
з набору даних та стандартизувати його.
Дякуємо за ваш відгук!
Тепер ми детальніше розглянемо створення PCA моделі на прикладі одного набору даних. В якості набору даних ми використаємо wine
з набору scikit-learn
. Він містить 13 характеристик вина та 3 класи. Він особливо зручний для нас тим, що в ньому немає категоріальних змінних.
Завантажимо набір даних:
Тепер давайте дослідимо набір даних, щоб зрозуміти, з якими даними ми працюємо. Перетворимо numpy
масив X
у фрейм даних pandas
і перевіримо кількість відсутніх даних:
Щоб отримати повний опис кожного стовпчика (середнє значення, стандартне відхилення тощо), використовуйте метод .describe()
:
Перш ніж завантажити набір даних у модель PCA, давайте опрацюємо наші дані. Виходячи з попередніх уроків, ви могли помітити, що важливим кроком є стандартизація даних. Ми реалізуємо це за допомогою класу StandardScaler()
:
Завдання
Прочитати дані з файлу train.csv
(файл з Інтернету). Видалити стовпець "Id"
з набору даних та стандартизувати його.