Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Кодування Категоріальних Змінних | Попередня Обробка Даних Із Scikit-learn
Вступ до машинного навчання з Python
close
Секція 2. Розділ 8
single

single

bookЗавдання: Кодування Категоріальних Змінних

Свайпніть щоб показати меню

Щоб підсумувати попередні три розділи, наведено таблицю, яка показує, який кодувальник слід використовувати:

У цьому завданні ви працюєте з набором даних penguins (без пропущених значень). Усі категоріальні ознаки — включаючи цільову 'species' — необхідно закодувати для використання в ML.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Майте на увазі, що 'island' та 'sex' є категоріальними ознаками, а 'species' — категоріальною цільовою змінною.

Завдання

Swipe to start coding

Вам надано DataFrame df. Закодуйте всі категоріальні стовпці:

  1. Імпортуйте OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Розділіть дані на X (ознаки) та y (ціль).
  3. Створіть OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть ці оригінальні стовпці на їх закодовані версії.
  5. Використайте LabelEncoder для стовпця 'species' для кодування y.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

some-alt