Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Створення Конвеєра | Конвеєри
Вступ до ML з Scikit-learn

bookЗавдання: Створення Конвеєра

У цьому завданні об'єднайте всі етапи попередньої обробки в єдиний конвеєр з використанням оригінального набору даних penguins.csv.

  1. Видаліть два рядки з недостатньою кількістю даних.
  2. Побудуйте конвеєр, що включає кодування, імпутацію та масштабування.

Потрібно кодувати лише два стовпці: 'sex' та 'island'. Оскільки не потрібно кодувати весь X, слід використовувати ColumnTransformer. Після цього застосуйте SimpleImputer та StandardScaler до всього X.

Нагадування про функції make_column_transformer() та make_pipeline(), які ви будете використовувати.

Завдання

Swipe to start coding

Вам надано DataFrame під назвою df, який містить дані про пінгвінів. Ваша мета — побудувати конвеєр попередньої обробки, який обробляє пропущені значення, кодує категоріальні стовпці та масштабує числові ознаки.

  1. Імпортуйте функцію make_pipeline з sklearn.pipeline.
  2. Створіть ColumnTransformer з назвою ct, який застосовує OneHotEncoder до стовпців 'sex' та 'island', залишаючи всі інші стовпці без змін (remainder='passthrough').
  3. Створіть конвеєр, який включає наступні кроки у такому порядку:
  • Визначений вами ColumnTransformer (ct);
  • SimpleImputer зі стратегією 'most_frequent';
  • StandardScaler для масштабування ознак.
  1. Застосуйте конвеєр до матриці ознак X і збережіть перетворені дані у змінну з назвою X_transformed.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.13

bookЗавдання: Створення Конвеєра

Свайпніть щоб показати меню

У цьому завданні об'єднайте всі етапи попередньої обробки в єдиний конвеєр з використанням оригінального набору даних penguins.csv.

  1. Видаліть два рядки з недостатньою кількістю даних.
  2. Побудуйте конвеєр, що включає кодування, імпутацію та масштабування.

Потрібно кодувати лише два стовпці: 'sex' та 'island'. Оскільки не потрібно кодувати весь X, слід використовувати ColumnTransformer. Після цього застосуйте SimpleImputer та StandardScaler до всього X.

Нагадування про функції make_column_transformer() та make_pipeline(), які ви будете використовувати.

Завдання

Swipe to start coding

Вам надано DataFrame під назвою df, який містить дані про пінгвінів. Ваша мета — побудувати конвеєр попередньої обробки, який обробляє пропущені значення, кодує категоріальні стовпці та масштабує числові ознаки.

  1. Імпортуйте функцію make_pipeline з sklearn.pipeline.
  2. Створіть ColumnTransformer з назвою ct, який застосовує OneHotEncoder до стовпців 'sex' та 'island', залишаючи всі інші стовпці без змін (remainder='passthrough').
  3. Створіть конвеєр, який включає наступні кроки у такому порядку:
  • Визначений вами ColumnTransformer (ct);
  • SimpleImputer зі стратегією 'most_frequent';
  • StandardScaler для масштабування ознак.
  1. Застосуйте конвеєр до матриці ознак X і збережіть перетворені дані у змінну з назвою X_transformed.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
single

single

some-alt