Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Досліджуємо набір даних | Побудова моделі
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Метод Головних Компонент

bookДосліджуємо набір даних

Тепер ми детальніше розглянемо створення PCA моделі на прикладі одного набору даних. В якості набору даних ми використаємо wine з набору scikit-learn. Він містить 13 характеристик вина та 3 класи. Він особливо зручний для нас тим, що в ньому немає категоріальних змінних.

Завантажимо набір даних:

# Importing library
from sklearn.datasets import load_wine

# Reading the dataset
data = load_wine()
X = data.data

Тепер давайте дослідимо набір даних, щоб зрозуміти, з якими даними ми працюємо. Перетворимо numpy масив X у фрейм даних pandas і перевіримо кількість відсутніх даних:

# Importing library
import pandas as pd

# Checking for missing data
df = pd.DataFrame(X, columns = data.feature_names)
(df.isnull() | df.empty | df.isna()).sum()

Щоб отримати повний опис кожного стовпчика (середнє значення, стандартне відхилення тощо), використовуйте метод .describe():

df.describe()

Перш ніж завантажити набір даних у модель PCA, давайте опрацюємо наші дані. Виходячи з попередніх уроків, ви могли помітити, що важливим кроком є стандартизація даних. Ми реалізуємо це за допомогою класу StandardScaler():

# Importing class
from sklearn.preprocessing import StandardScaler

# Standardization
X_scaled = StandardScaler().fit_transform(X)
Завдання

Swipe to start coding

Прочитати дані з файлу train.csv (файл з Інтернету). Видалити стовпець "Id" з набору даних та стандартизувати його.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 2
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Сумаризуйте цей розділ

Пояснити код у file

Пояснити, чому file не вирішує завдання

close

bookДосліджуємо набір даних

Свайпніть щоб показати меню

Тепер ми детальніше розглянемо створення PCA моделі на прикладі одного набору даних. В якості набору даних ми використаємо wine з набору scikit-learn. Він містить 13 характеристик вина та 3 класи. Він особливо зручний для нас тим, що в ньому немає категоріальних змінних.

Завантажимо набір даних:

# Importing library
from sklearn.datasets import load_wine

# Reading the dataset
data = load_wine()
X = data.data

Тепер давайте дослідимо набір даних, щоб зрозуміти, з якими даними ми працюємо. Перетворимо numpy масив X у фрейм даних pandas і перевіримо кількість відсутніх даних:

# Importing library
import pandas as pd

# Checking for missing data
df = pd.DataFrame(X, columns = data.feature_names)
(df.isnull() | df.empty | df.isna()).sum()

Щоб отримати повний опис кожного стовпчика (середнє значення, стандартне відхилення тощо), використовуйте метод .describe():

df.describe()

Перш ніж завантажити набір даних у модель PCA, давайте опрацюємо наші дані. Виходячи з попередніх уроків, ви могли помітити, що важливим кроком є стандартизація даних. Ми реалізуємо це за допомогою класу StandardScaler():

# Importing class
from sklearn.preprocessing import StandardScaler

# Standardization
X_scaled = StandardScaler().fit_transform(X)
Завдання

Swipe to start coding

Прочитати дані з файлу train.csv (файл з Інтернету). Видалити стовпець "Id" з набору даних та стандартизувати його.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 2
single

single

some-alt