Завдання: Кодування Категоріальних Змінних
Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який енкодер слід використовувати:
У цьому завданні надається набір даних penguins (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' column), необхідно закодувати.
Нагадування про структуру набору даних:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Майте на увазі, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.
Swipe to start coding
Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваше завдання — закодувати всі категоріальні ознаки, щоб дані можна було використовувати в моделі машинного навчання.
- Імпортуйте класи
OneHotEncoderтаLabelEncoderзsklearn.preprocessing. - Відокремте матрицю ознак
Xта цільову зміннуyзDataFrame. - Створіть об'єкт
OneHotEncoderі застосуйте його до стовпців'island'та'sex'уX. - Замініть оригінальні категоріальні стовпці на закодовані.
- Створіть об'єкт
LabelEncoderі застосуйте його до стовпця'species', щоб закодувати цільову зміннуy.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Завдання: Кодування Категоріальних Змінних
Свайпніть щоб показати меню
Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який енкодер слід використовувати:
У цьому завданні надається набір даних penguins (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' column), необхідно закодувати.
Нагадування про структуру набору даних:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Майте на увазі, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.
Swipe to start coding
Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваше завдання — закодувати всі категоріальні ознаки, щоб дані можна було використовувати в моделі машинного навчання.
- Імпортуйте класи
OneHotEncoderтаLabelEncoderзsklearn.preprocessing. - Відокремте матрицю ознак
Xта цільову зміннуyзDataFrame. - Створіть об'єкт
OneHotEncoderі застосуйте його до стовпців'island'та'sex'уX. - Замініть оригінальні категоріальні стовпці на закодовані.
- Створіть об'єкт
LabelEncoderі застосуйте його до стовпця'species', щоб закодувати цільову зміннуy.
Рішення
Дякуємо за ваш відгук!
single