Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Кодування Категоріальних Змінних | Попередня Обробка Даних Із Scikit-learn
Вступ до ML з Scikit-learn

bookЗавдання: Кодування Категоріальних Змінних

Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який енкодер слід використовувати:

У цьому завданні надається набір даних penguins (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' column), необхідно закодувати.

Нагадування про структуру набору даних:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Майте на увазі, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.

Завдання

Swipe to start coding

Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваше завдання — закодувати всі категоріальні ознаки, щоб дані можна було використовувати в моделі машинного навчання.

  1. Імпортуйте класи OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Відокремте матрицю ознак X та цільову змінну y з DataFrame.
  3. Створіть об'єкт OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть оригінальні категоріальні стовпці на закодовані.
  5. Створіть об'єкт LabelEncoder і застосуйте його до стовпця 'species', щоб закодувати цільову змінну y.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookЗавдання: Кодування Категоріальних Змінних

Свайпніть щоб показати меню

Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який енкодер слід використовувати:

У цьому завданні надається набір даних penguins (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' column), необхідно закодувати.

Нагадування про структуру набору даних:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Майте на увазі, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.

Завдання

Swipe to start coding

Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваше завдання — закодувати всі категоріальні ознаки, щоб дані можна було використовувати в моделі машинного навчання.

  1. Імпортуйте класи OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Відокремте матрицю ознак X та цільову змінну y з DataFrame.
  3. Створіть об'єкт OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть оригінальні категоріальні стовпці на закодовані.
  5. Створіть об'єкт LabelEncoder і застосуйте його до стовпця 'species', щоб закодувати цільову змінну y.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

some-alt