Що Ми Робитимемо з NaN-Значеннями?
У попередньому розділі ви отримали результат:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin
, у якому 327
пропущених значень. Заповнювати їх немає сенсу, оскільки інформації тут мінімум. Тому в цьому випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Одна з причин — ми можемо видалити лише ті рядки, які містять пропущені значення, але не можемо видалити 327 рядків із 418. Тож давайте розглянемо, як це зробити.
Щоб видалити стовпець, потрібно застосувати метод .drop()
до набору даних. Синтаксис наступний:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Пояснення:
.drop()
— метод, який видаляє стовпці;columns = 'column_name'
абоcolumns = ['column_1', 'column_2']
— аргумент функції, де вказується назва або назви стовпців, які потрібно видалити;inplace = True
— корисний аргумент pandas, який дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Swipe to start coding
Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:
- Видаліть стовпець
'Cabin'
, використовуючи аргументinplace = True
. - Виведіть випадкові
5
рядків з набору даних.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.03
Що Ми Робитимемо з NaN-Значеннями?
Свайпніть щоб показати меню
У попередньому розділі ви отримали результат:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin
, у якому 327
пропущених значень. Заповнювати їх немає сенсу, оскільки інформації тут мінімум. Тому в цьому випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Одна з причин — ми можемо видалити лише ті рядки, які містять пропущені значення, але не можемо видалити 327 рядків із 418. Тож давайте розглянемо, як це зробити.
Щоб видалити стовпець, потрібно застосувати метод .drop()
до набору даних. Синтаксис наступний:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Пояснення:
.drop()
— метод, який видаляє стовпці;columns = 'column_name'
абоcolumns = ['column_1', 'column_2']
— аргумент функції, де вказується назва або назви стовпців, які потрібно видалити;inplace = True
— корисний аргумент pandas, який дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Swipe to start coding
Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:
- Видаліть стовпець
'Cabin'
, використовуючи аргументinplace = True
. - Виведіть випадкові
5
рядків з набору даних.
Рішення
Дякуємо за ваш відгук!
single