Вивчайте Що Ми Робитимемо з NaN-Значеннями?

У попередньому розділі ви отримали результат:


PassengerId	0
Survived	0
Pclass	0
Name	0
Sex	0
Age	86
SibSp	0
Parch	0
Ticket	0
Fare	1
Cabin	327
Embarked	0

У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin, у якому 327 пропущених значень. Заповнювати їх немає сенсу, оскільки інформації тут мінімум. Тому в цьому випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Одна з причин — ми можемо видалити лише ті рядки, які містять пропущені значення, але не можемо видалити 327 рядків із 418. Тож давайте розглянемо, як це зробити.

Щоб видалити стовпець, потрібно застосувати метод .drop() до набору даних. Синтаксис наступний:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Пояснення:

.drop() — метод, який видаляє стовпці;
columns = 'column_name' або columns = ['column_1', 'column_2'] — аргумент функції, де вказується назва або назви стовпців, які потрібно видалити;
inplace = True — корисний аргумент pandas, який дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.

Завдання

Swipe to start coding

Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:

Видаліть стовпець 'Cabin', використовуючи аргумент inplace = True.
Виведіть випадкові 5 рядків з набору даних.

Рішення

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 5. Розділ 3

single

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain what happens if I don't use `inplace=True`?

What should I do if I want to delete multiple columns at once?

Is there a way to undo the column deletion if I make a mistake?

Свайпніть щоб показати меню