Заповнення Пропущених Значень
Видалення пропущених значень — не єдиний спосіб їх усунення. Ви також можете замінити всі NaN на визначене значення, наприклад, на середнє значення стовпця або на нулі. Це може бути корисно у багатьох випадках. Ви дізнаєтеся про це у курсі Вивчення статистики з Python.
Розгляньте приклад заповнення пропущених значень у стовпці 'Age' медіанним значенням цього стовпця:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Пояснення:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()— за допомогою аргументуvalueми вказуємо методу.fillna(), що робити зNaNзначеннями. У цьому випадку ми застосували метод.fillna()до стовпця'Age'і замінили всі пропущені значення на медіану цього стовпця;inplace=True— аргумент, який дозволяє зберегти зміни.
Swipe to start coding
Відсутні значення можуть спричиняти проблеми під час аналізу даних. Один із найпоширеніших способів їх обробки — заміна відсутніх значень на середнє значення стовпця.
Ваше завдання:
- Замініть усі значення
NaNу стовпці'Age'на середнє цього стовпця.
- Використайте метод
.fillna()з аргументамиvalue=data['Age'].mean()таinplace=True.
- Обчисліть і виведіть кількість залишкових відсутніх значень у стовпці
'Age'.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Заповнення Пропущених Значень
Свайпніть щоб показати меню
Видалення пропущених значень — не єдиний спосіб їх усунення. Ви також можете замінити всі NaN на визначене значення, наприклад, на середнє значення стовпця або на нулі. Це може бути корисно у багатьох випадках. Ви дізнаєтеся про це у курсі Вивчення статистики з Python.
Розгляньте приклад заповнення пропущених значень у стовпці 'Age' медіанним значенням цього стовпця:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Пояснення:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()— за допомогою аргументуvalueми вказуємо методу.fillna(), що робити зNaNзначеннями. У цьому випадку ми застосували метод.fillna()до стовпця'Age'і замінили всі пропущені значення на медіану цього стовпця;inplace=True— аргумент, який дозволяє зберегти зміни.
Swipe to start coding
Відсутні значення можуть спричиняти проблеми під час аналізу даних. Один із найпоширеніших способів їх обробки — заміна відсутніх значень на середнє значення стовпця.
Ваше завдання:
- Замініть усі значення
NaNу стовпці'Age'на середнє цього стовпця.
- Використайте метод
.fillna()з аргументамиvalue=data['Age'].mean()таinplace=True.
- Обчисліть і виведіть кількість залишкових відсутніх значень у стовпці
'Age'.
Рішення
Дякуємо за ваш відгук!
single