Завдання: Заповнення Пропущених Значень
Клас SimpleImputer автоматично замінює відсутні значення.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Основні параметри:
missing_value: позначення, яке вважається відсутнім (типовоnp.nan);strategy: метод заповнення пропусків (типово'mean');fill_value: використовується, якщоstrategy='constant'.
Як трансформер, надає методи .fit(), .transform(), та .fit_transform().
Вибір способу заповнення відсутніх даних є важливим. Поширений підхід:
- числові ознаки → середнє значення;
- категоріальні ознаки → найчастіше значення.
Опції параметра strategy:
'mean'— заповнення середнім значенням;'median'— заповнення медіаною;'most_frequent'— заповнення модою;'constant'— заповнення вказаним значенням черезfill_value.
missing_values визначає, які значення вважаються відсутніми (типово NaN, але може бути '' або інший маркер).
SimpleImputer очікує DataFrame, а не Series.
Для вибору DataFrame з одним стовпцем слід використовувати подвійні дужки:
imputer.fit_transform(df[['column']])
fit_transform() повертає 2D-масив, але для присвоєння значення назад у стовпець DataFrame потрібен 1D-масив.
Використайте .ravel() для перетворення результату:
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Вам надано DataFrame df з даними про пінгвінів. У стовпці 'sex' є пропущені значення. Заповніть їх, використовуючи найчастішу категорію.
- Імпортуйте
SimpleImputer; - Створіть імпутер зі стратегією
strategy='most_frequent'; - Застосуйте його до
df[['sex']]; - Призначте імпутовані значення назад у
df['sex'].
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain how to use SimpleImputer with categorical data?
What happens if my data has multiple types of missing value markers?
Can you show an example of using a different strategy, like 'median'?
Awesome!
Completion rate improved to 3.13
Завдання: Заповнення Пропущених Значень
Свайпніть щоб показати меню
Клас SimpleImputer автоматично замінює відсутні значення.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Основні параметри:
missing_value: позначення, яке вважається відсутнім (типовоnp.nan);strategy: метод заповнення пропусків (типово'mean');fill_value: використовується, якщоstrategy='constant'.
Як трансформер, надає методи .fit(), .transform(), та .fit_transform().
Вибір способу заповнення відсутніх даних є важливим. Поширений підхід:
- числові ознаки → середнє значення;
- категоріальні ознаки → найчастіше значення.
Опції параметра strategy:
'mean'— заповнення середнім значенням;'median'— заповнення медіаною;'most_frequent'— заповнення модою;'constant'— заповнення вказаним значенням черезfill_value.
missing_values визначає, які значення вважаються відсутніми (типово NaN, але може бути '' або інший маркер).
SimpleImputer очікує DataFrame, а не Series.
Для вибору DataFrame з одним стовпцем слід використовувати подвійні дужки:
imputer.fit_transform(df[['column']])
fit_transform() повертає 2D-масив, але для присвоєння значення назад у стовпець DataFrame потрібен 1D-масив.
Використайте .ravel() для перетворення результату:
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Вам надано DataFrame df з даними про пінгвінів. У стовпці 'sex' є пропущені значення. Заповніть їх, використовуючи найчастішу категорію.
- Імпортуйте
SimpleImputer; - Створіть імпутер зі стратегією
strategy='most_frequent'; - Застосуйте його до
df[['sex']]; - Призначте імпутовані значення назад у
df['sex'].
Рішення
Дякуємо за ваш відгук!
single