Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Стандартизація | Основні поняття РСА
Метод Головних Компонент
course content

Зміст курсу

Метод Головних Компонент

Метод Головних Компонент

1. Що таке аналіз головних компонент
2. Основні поняття РСА
3. Побудова моделі
4. Аналіз результатів

Стандартизація

Нарешті, почнемо з аналізу математичної моделі PCA.

Перш за все, ми почнемо зі стандартизації даних, з якими працюватиме алгоритм. Під стандартизацією мається на увазі зведення всіх неперервних змінних до набору, де середнє значення буде дорівнювати 0.

Це важливий крок, оскільки PCA не може працювати належним чином, якщо в наборі даних є змінна з діапазоном значень 0-20 і 100-10 000, наприклад. PCA почне "ігнорувати" характеристику з невеликим розкидом (0-20), і вона не зможе вплинути на результат алгоритму.

Формула для стандартизації даних дуже проста. Відніміть від значення змінної середнє значення і розділіть результат на стандартне відхилення:

Бібліотека Python scikit-learn дозволяє зробити це в 1 рядок:

Завдання

Реалізувати стандартизацію масиву X за допомогою numpy функцій np.mean() та np.std().

Завдання

Реалізувати стандартизацію масиву X за допомогою numpy функцій np.mean() та np.std().

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Секція 2. Розділ 1
toggle bottom row

Стандартизація

Нарешті, почнемо з аналізу математичної моделі PCA.

Перш за все, ми почнемо зі стандартизації даних, з якими працюватиме алгоритм. Під стандартизацією мається на увазі зведення всіх неперервних змінних до набору, де середнє значення буде дорівнювати 0.

Це важливий крок, оскільки PCA не може працювати належним чином, якщо в наборі даних є змінна з діапазоном значень 0-20 і 100-10 000, наприклад. PCA почне "ігнорувати" характеристику з невеликим розкидом (0-20), і вона не зможе вплинути на результат алгоритму.

Формула для стандартизації даних дуже проста. Відніміть від значення змінної середнє значення і розділіть результат на стандартне відхилення:

Бібліотека Python scikit-learn дозволяє зробити це в 1 рядок:

Завдання

Реалізувати стандартизацію масиву X за допомогою numpy функцій np.mean() та np.std().

Завдання

Реалізувати стандартизацію масиву X за допомогою numpy функцій np.mean() та np.std().

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Секція 2. Розділ 1
toggle bottom row

Стандартизація

Нарешті, почнемо з аналізу математичної моделі PCA.

Перш за все, ми почнемо зі стандартизації даних, з якими працюватиме алгоритм. Під стандартизацією мається на увазі зведення всіх неперервних змінних до набору, де середнє значення буде дорівнювати 0.

Це важливий крок, оскільки PCA не може працювати належним чином, якщо в наборі даних є змінна з діапазоном значень 0-20 і 100-10 000, наприклад. PCA почне "ігнорувати" характеристику з невеликим розкидом (0-20), і вона не зможе вплинути на результат алгоритму.

Формула для стандартизації даних дуже проста. Відніміть від значення змінної середнє значення і розділіть результат на стандартне відхилення:

Бібліотека Python scikit-learn дозволяє зробити це в 1 рядок:

Завдання

Реалізувати стандартизацію масиву X за допомогою numpy функцій np.mean() та np.std().

Завдання

Реалізувати стандартизацію масиву X за допомогою numpy функцій np.mean() та np.std().

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Нарешті, почнемо з аналізу математичної моделі PCA.

Перш за все, ми почнемо зі стандартизації даних, з якими працюватиме алгоритм. Під стандартизацією мається на увазі зведення всіх неперервних змінних до набору, де середнє значення буде дорівнювати 0.

Це важливий крок, оскільки PCA не може працювати належним чином, якщо в наборі даних є змінна з діапазоном значень 0-20 і 100-10 000, наприклад. PCA почне "ігнорувати" характеристику з невеликим розкидом (0-20), і вона не зможе вплинути на результат алгоритму.

Формула для стандартизації даних дуже проста. Відніміть від значення змінної середнє значення і розділіть результат на стандартне відхилення:

Бібліотека Python scikit-learn дозволяє зробити це в 1 рядок:

Завдання

Реалізувати стандартизацію масиву X за допомогою numpy функцій np.mean() та np.std().

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Секція 2. Розділ 1
Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
We're sorry to hear that something went wrong. What happened?
some-alt