Парний Графік
Pair plot використовується для візуалізації парних взаємозв'язків між числовими змінними у наборі даних. Він схожий на joint plot, однак не обмежується лише двома змінними. Насправді, pair plot створює сітку NxN з об'єктів Axes (декілька підграфіків), де N — це кількість числових змінних (числових стовпців у DataFrame).
Опис Pair Plot
У pair plot кожен стовпець має спільну змінну по осі x, а кожен рядок — спільну змінну по осі y. Діагональ відображає гістограми окремих змінних, тоді як інші графіки показують точкові діаграми.
Створення Pair Plot
Створення pair plot у seaborn зводиться до виклику функції pairplot(). Її найважливіший і єдиний обов'язковий параметр — це data, який повинен бути об'єктом типу DataFrame.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame iris_df передається у функцію pairplot(). Параметри height та aspect визначають висоту та ширину (обчислюється як висота, помножена на aspect) кожної фасетки у дюймах.
Hue
Ще одним параметром, який варто згадати, є hue, що визначає змінну (назву стовпця) у data для відображення аспектів графіка різними кольорами або навіть створення окремих графіків (на одній Axes) для кожного її значення.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Тут чітко видно різницю. Точки даних на кожному діаграмі розсіювання забарвлені відповідно до виду, до якого вони належать, використовуючи значення зі стовпця species. Діагональні графіки тепер є KDE-графіками для кожного виду замість гістограм.
У задачах класифікації часто доцільно створювати pair plot із параметром hue, встановленим на цільову змінну, тобто категоріальну змінну, яку потрібно передбачити.
Різниця очевидна. Точки даних на кожному діаграмі розсіювання забарвлені відповідно до їхнього виду, на основі значень у стовпці species. Діагональні графіки замінено на KDE-графіки для кожного виду замість гістограм.
У задачах класифікації створення pair plot із параметром hue, встановленим на цільову змінну — категоріальну змінну, яку потрібно передбачити — часто є корисним.
Зміна типів графіків
Можна змінювати тип графіків, які використовуються замість стандартних точкових діаграм, а також графіки, що відображаються на діагоналі. Параметр kind керує основними графіками та за замовчуванням встановлений на точкові діаграми, тоді як параметр diag_kind керує діагональними графіками й автоматично вибирається залежно від того, чи встановлено параметр hue.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' — можливі значення для параметра kind.
diag_kind може бути встановлений на одне з наступних значень:
'auto';'hist';'kde';None.
У цьому аспекті все подібно до функції jointplot().
Детальніше досліджуйте у документації pairplot().
Swipe to start coding
- Використати відповідну функцію для створення pair plot.
- Встановити дані для графіка як
penguins_dfчерез перший аргумент. - Вказати стовпець
'sex'для відображення різних аспектів графіка різними кольорами, задавши другий аргумент. - Для недіагональних графіків встановити лінію регресії (
'reg'), вказавши третій аргумент. - Встановити
heightна2. - Встановити
aspectна0.8.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.85
Парний Графік
Свайпніть щоб показати меню
Pair plot використовується для візуалізації парних взаємозв'язків між числовими змінними у наборі даних. Він схожий на joint plot, однак не обмежується лише двома змінними. Насправді, pair plot створює сітку NxN з об'єктів Axes (декілька підграфіків), де N — це кількість числових змінних (числових стовпців у DataFrame).
Опис Pair Plot
У pair plot кожен стовпець має спільну змінну по осі x, а кожен рядок — спільну змінну по осі y. Діагональ відображає гістограми окремих змінних, тоді як інші графіки показують точкові діаграми.
Створення Pair Plot
Створення pair plot у seaborn зводиться до виклику функції pairplot(). Її найважливіший і єдиний обов'язковий параметр — це data, який повинен бути об'єктом типу DataFrame.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame iris_df передається у функцію pairplot(). Параметри height та aspect визначають висоту та ширину (обчислюється як висота, помножена на aspect) кожної фасетки у дюймах.
Hue
Ще одним параметром, який варто згадати, є hue, що визначає змінну (назву стовпця) у data для відображення аспектів графіка різними кольорами або навіть створення окремих графіків (на одній Axes) для кожного її значення.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Тут чітко видно різницю. Точки даних на кожному діаграмі розсіювання забарвлені відповідно до виду, до якого вони належать, використовуючи значення зі стовпця species. Діагональні графіки тепер є KDE-графіками для кожного виду замість гістограм.
У задачах класифікації часто доцільно створювати pair plot із параметром hue, встановленим на цільову змінну, тобто категоріальну змінну, яку потрібно передбачити.
Різниця очевидна. Точки даних на кожному діаграмі розсіювання забарвлені відповідно до їхнього виду, на основі значень у стовпці species. Діагональні графіки замінено на KDE-графіки для кожного виду замість гістограм.
У задачах класифікації створення pair plot із параметром hue, встановленим на цільову змінну — категоріальну змінну, яку потрібно передбачити — часто є корисним.
Зміна типів графіків
Можна змінювати тип графіків, які використовуються замість стандартних точкових діаграм, а також графіки, що відображаються на діагоналі. Параметр kind керує основними графіками та за замовчуванням встановлений на точкові діаграми, тоді як параметр diag_kind керує діагональними графіками й автоматично вибирається залежно від того, чи встановлено параметр hue.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' — можливі значення для параметра kind.
diag_kind може бути встановлений на одне з наступних значень:
'auto';'hist';'kde';None.
У цьому аспекті все подібно до функції jointplot().
Детальніше досліджуйте у документації pairplot().
Swipe to start coding
- Використати відповідну функцію для створення pair plot.
- Встановити дані для графіка як
penguins_dfчерез перший аргумент. - Вказати стовпець
'sex'для відображення різних аспектів графіка різними кольорами, задавши другий аргумент. - Для недіагональних графіків встановити лінію регресії (
'reg'), вказавши третій аргумент. - Встановити
heightна2. - Встановити
aspectна0.8.
Рішення
Дякуємо за ваш відгук!
single