Завдання: Створення Конвеєра
У цьому завданні об'єднайте всі етапи попередньої обробки в єдиний конвеєр з використанням оригінального набору даних penguins.csv.
- Видаліть два рядки з недостатньою кількістю даних.
- Побудуйте конвеєр, що включає кодування, імпутацію та масштабування.
Потрібно кодувати лише два стовпці: 'sex' та 'island'. Оскільки не потрібно кодувати весь X, слід використовувати ColumnTransformer. Після цього застосуйте SimpleImputer та StandardScaler до всього X.
Нагадування про функції make_column_transformer() та make_pipeline(), які ви будете використовувати.
Swipe to start coding
Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваша мета — побудувати конвеєр попередньої обробки, який обробляє пропущені значення, кодує категоріальні стовпці та масштабує числові ознаки.
- Імпортуйте функцію
make_pipelineзsklearn.pipeline. - Створіть
ColumnTransformerз назвоюct, який застосовуєOneHotEncoderдо стовпців'sex'та'island', залишаючи всі інші стовпці без змін (remainder='passthrough'). - Створіть конвеєр, який включає наступні кроки у такому порядку:
- Визначений вами
ColumnTransformer(ct); SimpleImputerзі стратегією'most_frequent';StandardScalerдля масштабування ознак.
- Застосуйте конвеєр до матриці ознак
Xі збережіть перетворені дані у змінну з назвоюX_transformed.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.13
Завдання: Створення Конвеєра
Свайпніть щоб показати меню
У цьому завданні об'єднайте всі етапи попередньої обробки в єдиний конвеєр з використанням оригінального набору даних penguins.csv.
- Видаліть два рядки з недостатньою кількістю даних.
- Побудуйте конвеєр, що включає кодування, імпутацію та масштабування.
Потрібно кодувати лише два стовпці: 'sex' та 'island'. Оскільки не потрібно кодувати весь X, слід використовувати ColumnTransformer. Після цього застосуйте SimpleImputer та StandardScaler до всього X.
Нагадування про функції make_column_transformer() та make_pipeline(), які ви будете використовувати.
Swipe to start coding
Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваша мета — побудувати конвеєр попередньої обробки, який обробляє пропущені значення, кодує категоріальні стовпці та масштабує числові ознаки.
- Імпортуйте функцію
make_pipelineзsklearn.pipeline. - Створіть
ColumnTransformerз назвоюct, який застосовуєOneHotEncoderдо стовпців'sex'та'island', залишаючи всі інші стовпці без змін (remainder='passthrough'). - Створіть конвеєр, який включає наступні кроки у такому порядку:
- Визначений вами
ColumnTransformer(ct); SimpleImputerзі стратегією'most_frequent';StandardScalerдля масштабування ознак.
- Застосуйте конвеєр до матриці ознак
Xі збережіть перетворені дані у змінну з назвоюX_transformed.
Рішення
Дякуємо за ваш відгук!
single