Contenu du cours
Visualisation Ultime Avec Python
Visualisation Ultime Avec Python
Tracé Conjoint
Joint plot est un graphique plutôt unique, car il combine plusieurs graphiques. Fondamentalement, il a trois éléments par défaut :
- histogramme en haut qui représente la distribution d'une certaine variable ;
- histogramme à droite qui représente la distribution d'une autre variable ;
- nuage de points au milieu qui montre la relation entre ces deux variables.
Voici un exemple de joint plot :
Données pour le Joint Plot
seaborn
a une fonction jointplot()
qui, de manière similaire à countplot()
et kdeplot()
, a trois paramètres les plus importants :
data
;x
;y
.
Les paramètres x
et y
sont les variables qui nous intéressent (l'histogramme à droite et en haut respectivement), elles peuvent être soit des objets de type array-like soit les noms des colonnes d'un DataFrame
(si nous définissons également le paramètre data
comme un DataFrame
).
Jetons un coup d'œil à un exemple :
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Nous venons de recréer l'exemple que nous avions au début en définissant un objet DataFrame
pour le paramètre data
et les noms des colonnes pour x
et y
.
Tracé au Milieu
Un autre paramètre assez utile est kind
qui spécifie le tracé que vous avez au milieu. 'scatter'
est sa valeur par défaut. Voici d'autres tracés possibles : 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. N'hésitez pas à expérimenter avec différents tracés :
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Types de Graphiques
Bien que le nuage de points soit principalement utilisé pour le graphique au milieu, voici quelques autres graphiques juste pour information :
'reg'
crée un modèle de régression linéaire ajusté avec le nuage de points, ce qui est utile pour vérifier si deux variables sont corrélées ;'resid'
trace les résidus d'une régression linéaire (documentation);'hist'
crée un histogramme bivarié (pour deux variables) ;'kde'
crée un graphique KDE ;'hex'
crée un graphique hexbin. C'est un nuage de points où des bacs hexagonaux sont utilisés à la place des points de données individuels, et la couleur de chaque bac indique combien de points de données y tombent.
Comme d'habitude, n'hésitez pas à explorer plus de paramètres dans la documentation.
Swipe to start coding
- Utilisez la fonction correcte pour créer un graphique conjoint.
- Utilisez
weather_df
comme données pour le graphique (le premier argument). - Définissez la colonne
'Boston'
pour la variable de l'axe des x (le deuxième argument). - Définissez la colonne
'Seattle'
pour la variable de l'axe des y (le troisième argument). - Définissez le graphique au milieu pour avoir une ligne de régression (l'argument le plus à droite).
Solution
Merci pour vos commentaires !
Tracé Conjoint
Joint plot est un graphique plutôt unique, car il combine plusieurs graphiques. Fondamentalement, il a trois éléments par défaut :
- histogramme en haut qui représente la distribution d'une certaine variable ;
- histogramme à droite qui représente la distribution d'une autre variable ;
- nuage de points au milieu qui montre la relation entre ces deux variables.
Voici un exemple de joint plot :
Données pour le Joint Plot
seaborn
a une fonction jointplot()
qui, de manière similaire à countplot()
et kdeplot()
, a trois paramètres les plus importants :
data
;x
;y
.
Les paramètres x
et y
sont les variables qui nous intéressent (l'histogramme à droite et en haut respectivement), elles peuvent être soit des objets de type array-like soit les noms des colonnes d'un DataFrame
(si nous définissons également le paramètre data
comme un DataFrame
).
Jetons un coup d'œil à un exemple :
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Nous venons de recréer l'exemple que nous avions au début en définissant un objet DataFrame
pour le paramètre data
et les noms des colonnes pour x
et y
.
Tracé au Milieu
Un autre paramètre assez utile est kind
qui spécifie le tracé que vous avez au milieu. 'scatter'
est sa valeur par défaut. Voici d'autres tracés possibles : 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. N'hésitez pas à expérimenter avec différents tracés :
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Types de Graphiques
Bien que le nuage de points soit principalement utilisé pour le graphique au milieu, voici quelques autres graphiques juste pour information :
'reg'
crée un modèle de régression linéaire ajusté avec le nuage de points, ce qui est utile pour vérifier si deux variables sont corrélées ;'resid'
trace les résidus d'une régression linéaire (documentation);'hist'
crée un histogramme bivarié (pour deux variables) ;'kde'
crée un graphique KDE ;'hex'
crée un graphique hexbin. C'est un nuage de points où des bacs hexagonaux sont utilisés à la place des points de données individuels, et la couleur de chaque bac indique combien de points de données y tombent.
Comme d'habitude, n'hésitez pas à explorer plus de paramètres dans la documentation.
Swipe to start coding
- Utilisez la fonction correcte pour créer un graphique conjoint.
- Utilisez
weather_df
comme données pour le graphique (le premier argument). - Définissez la colonne
'Boston'
pour la variable de l'axe des x (le deuxième argument). - Définissez la colonne
'Seattle'
pour la variable de l'axe des y (le troisième argument). - Définissez le graphique au milieu pour avoir une ligne de régression (l'argument le plus à droite).
Solution
Merci pour vos commentaires !