Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Що Ми Робитимемо з NaN-Значеннями? | Попередня Обробка Даних
Просунуті Техніки в Pandas

bookЩо Ми Робитимемо з NaN-Значеннями?

У попередньому розділі ви отримали результат:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin, у якому 327 пропущених значень. Заповнювати їх немає сенсу, оскільки інформації тут мінімум. Тому в цьому випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Одна з причин — ми можемо видалити лише ті рядки, які містять пропущені значення, але не можемо видалити 327 рядків із 418. Тож давайте розглянемо, як це зробити.

Щоб видалити стовпець, потрібно застосувати метод .drop() до набору даних. Синтаксис наступний:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Пояснення:

  • .drop() — метод, який видаляє стовпці;
  • columns = 'column_name' або columns = ['column_1', 'column_2'] — аргумент функції, де вказується назва або назви стовпців, які потрібно видалити;
  • inplace = True — корисний аргумент pandas, який дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Завдання

Swipe to start coding

Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:

  1. Видаліть стовпець 'Cabin', використовуючи аргумент inplace = True.
  2. Виведіть випадкові 5 рядків з набору даних.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 3
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.03

bookЩо Ми Робитимемо з NaN-Значеннями?

Свайпніть щоб показати меню

У попередньому розділі ви отримали результат:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin, у якому 327 пропущених значень. Заповнювати їх немає сенсу, оскільки інформації тут мінімум. Тому в цьому випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Одна з причин — ми можемо видалити лише ті рядки, які містять пропущені значення, але не можемо видалити 327 рядків із 418. Тож давайте розглянемо, як це зробити.

Щоб видалити стовпець, потрібно застосувати метод .drop() до набору даних. Синтаксис наступний:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Пояснення:

  • .drop() — метод, який видаляє стовпці;
  • columns = 'column_name' або columns = ['column_1', 'column_2'] — аргумент функції, де вказується назва або назви стовпців, які потрібно видалити;
  • inplace = True — корисний аргумент pandas, який дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Завдання

Swipe to start coding

Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:

  1. Видаліть стовпець 'Cabin', використовуючи аргумент inplace = True.
  2. Виведіть випадкові 5 рядків з набору даних.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 3
single

single

some-alt