Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Конвеєр Попередньої Обробки | Інженерія Ознак для Машинного Навчання
Попередня Обробка Даних та Створення Ознак

bookЗавдання: Конвеєр Попередньої Обробки

Завдання

Swipe to start coding

Вам надано датасет Titanic з бібліотеки seaborn. Ваше завдання — побудувати повний конвеєр попередньої обробки даних, який виконує всі основні трансформації даних, необхідні перед машинним навчанням.

Виконайте наступні кроки:

  1. Завантажте датасет за допомогою sns.load_dataset("titanic").
  2. Обробіть пропущені значення:
  • Числові стовпці → заповнити середнім значенням.
  • Категоріальні стовпці → заповнити модою.
  1. Закодуйте категоріальні ознаки sex та embarked за допомогою pd.get_dummies().
  2. Масштабуйте числові стовпці age та fare за допомогою StandardScaler.
  3. Створіть нову ознаку family_size = sibsp + parch + 1.
  4. Об'єднайте всі трансформації у функцію з назвою preprocess_titanic(data), яка повертає фінальний оброблений DataFrame.
  5. Присвойте оброблений датасет змінній з назвою processed_data.

Виведіть перші 5 рядків фінального DataFrame.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 8.33

bookЗавдання: Конвеєр Попередньої Обробки

Свайпніть щоб показати меню

Завдання

Swipe to start coding

Вам надано датасет Titanic з бібліотеки seaborn. Ваше завдання — побудувати повний конвеєр попередньої обробки даних, який виконує всі основні трансформації даних, необхідні перед машинним навчанням.

Виконайте наступні кроки:

  1. Завантажте датасет за допомогою sns.load_dataset("titanic").
  2. Обробіть пропущені значення:
  • Числові стовпці → заповнити середнім значенням.
  • Категоріальні стовпці → заповнити модою.
  1. Закодуйте категоріальні ознаки sex та embarked за допомогою pd.get_dummies().
  2. Масштабуйте числові стовпці age та fare за допомогою StandardScaler.
  3. Створіть нову ознаку family_size = sibsp + parch + 1.
  4. Об'єднайте всі трансформації у функцію з назвою preprocess_titanic(data), яка повертає фінальний оброблений DataFrame.
  5. Присвойте оброблений датасет змінній з назвою processed_data.

Виведіть перші 5 рядків фінального DataFrame.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
single

single

some-alt