Видалення Викидів за Допомогою Методу IQR
Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).
Що таке IQR?
Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:
IQR=Q3−Q1Де:
- Q1: 25-й процентиль (перший квартиль);
- Q3: 75-й процентиль (третій квартиль).
Значення, що лежать нижче Q1−1.5×IQR або вище Q3+1.5×IQR, зазвичай вважаються викидами.
Обчислення IQR
Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile(). Далі можна обчислити значення IQR за наведеною формулою.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Визначення викидів
Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Далі можна або вибрати всі викиди для аналізу:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
Або створити набір даних без викидів:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain why the IQR method is preferred for non-normally distributed data?
How do I interpret the results after removing outliers using IQR?
What should I do if my dataset has outliers on both the lower and upper boundaries?
Awesome!
Completion rate improved to 4
Видалення Викидів за Допомогою Методу IQR
Свайпніть щоб показати меню
Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).
Що таке IQR?
Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:
IQR=Q3−Q1Де:
- Q1: 25-й процентиль (перший квартиль);
- Q3: 75-й процентиль (третій квартиль).
Значення, що лежать нижче Q1−1.5×IQR або вище Q3+1.5×IQR, зазвичай вважаються викидами.
Обчислення IQR
Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile(). Далі можна обчислити значення IQR за наведеною формулою.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Визначення викидів
Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Далі можна або вибрати всі викиди для аналізу:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
Або створити набір даних без викидів:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
Дякуємо за ваш відгук!