Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Tracé Conjoint | Tracé avec Seaborn
Visualisation Ultime Avec Python
course content

Contenu du cours

Visualisation Ultime Avec Python

Visualisation Ultime Avec Python

1. Introduction à Matplotlib
2. Création de Graphiques Couramment Utilisés
3. Personnalisation des Graphiques
4. Plus de Graphiques Statistiques
5. Tracé avec Seaborn

book
Tracé Conjoint

Joint plot est un graphique plutôt unique, car il combine plusieurs graphiques. Fondamentalement, il a trois éléments par défaut :

  • histogramme en haut qui représente la distribution d'une certaine variable ;
  • histogramme à droite qui représente la distribution d'une autre variable ;
  • nuage de points au milieu qui montre la relation entre ces deux variables.

Voici un exemple de joint plot :

Données pour le Joint Plot

seaborn a une fonction jointplot() qui, de manière similaire à countplot() et kdeplot(), a trois paramètres les plus importants :

  • data;
  • x;
  • y.

Les paramètres x et y sont les variables qui nous intéressent (l'histogramme à droite et en haut respectivement), elles peuvent être soit des objets de type array-like soit les noms des colonnes d'un DataFrame (si nous définissons également le paramètre data comme un DataFrame).

Jetons un coup d'œil à un exemple :

123456
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
copy

Nous venons de recréer l'exemple que nous avions au début en définissant un objet DataFrame pour le paramètre data et les noms des colonnes pour x et y.

Tracé au Milieu

Un autre paramètre assez utile est kind qui spécifie le tracé que vous avez au milieu. 'scatter' est sa valeur par défaut. Voici d'autres tracés possibles : 'kde', 'hist', 'hex', 'reg', 'resid'. N'hésitez pas à expérimenter avec différents tracés :

123456
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
copy

Types de Graphiques

Bien que le nuage de points soit principalement utilisé pour le graphique au milieu, voici quelques autres graphiques juste pour information :

  • 'reg' crée un modèle de régression linéaire ajusté avec le nuage de points, ce qui est utile pour vérifier si deux variables sont corrélées ;
  • 'resid' trace les résidus d'une régression linéaire (documentation);
  • 'hist' crée un histogramme bivarié (pour deux variables) ;
  • 'kde' crée un graphique KDE ;
  • 'hex' crée un graphique hexbin. C'est un nuage de points où des bacs hexagonaux sont utilisés à la place des points de données individuels, et la couleur de chaque bac indique combien de points de données y tombent.

Comme d'habitude, n'hésitez pas à explorer plus de paramètres dans la documentation.

Tâche

Swipe to start coding

  1. Utilisez la fonction correcte pour créer un graphique conjoint.
  2. Utilisez weather_df comme données pour le graphique (le premier argument).
  3. Définissez la colonne 'Boston' pour la variable de l'axe des x (le deuxième argument).
  4. Définissez la colonne 'Seattle' pour la variable de l'axe des y (le troisième argument).
  5. Définissez le graphique au milieu pour avoir une ligne de régression (l'argument le plus à droite).

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 5
toggle bottom row

book
Tracé Conjoint

Joint plot est un graphique plutôt unique, car il combine plusieurs graphiques. Fondamentalement, il a trois éléments par défaut :

  • histogramme en haut qui représente la distribution d'une certaine variable ;
  • histogramme à droite qui représente la distribution d'une autre variable ;
  • nuage de points au milieu qui montre la relation entre ces deux variables.

Voici un exemple de joint plot :

Données pour le Joint Plot

seaborn a une fonction jointplot() qui, de manière similaire à countplot() et kdeplot(), a trois paramètres les plus importants :

  • data;
  • x;
  • y.

Les paramètres x et y sont les variables qui nous intéressent (l'histogramme à droite et en haut respectivement), elles peuvent être soit des objets de type array-like soit les noms des colonnes d'un DataFrame (si nous définissons également le paramètre data comme un DataFrame).

Jetons un coup d'œil à un exemple :

123456
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
copy

Nous venons de recréer l'exemple que nous avions au début en définissant un objet DataFrame pour le paramètre data et les noms des colonnes pour x et y.

Tracé au Milieu

Un autre paramètre assez utile est kind qui spécifie le tracé que vous avez au milieu. 'scatter' est sa valeur par défaut. Voici d'autres tracés possibles : 'kde', 'hist', 'hex', 'reg', 'resid'. N'hésitez pas à expérimenter avec différents tracés :

123456
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
copy

Types de Graphiques

Bien que le nuage de points soit principalement utilisé pour le graphique au milieu, voici quelques autres graphiques juste pour information :

  • 'reg' crée un modèle de régression linéaire ajusté avec le nuage de points, ce qui est utile pour vérifier si deux variables sont corrélées ;
  • 'resid' trace les résidus d'une régression linéaire (documentation);
  • 'hist' crée un histogramme bivarié (pour deux variables) ;
  • 'kde' crée un graphique KDE ;
  • 'hex' crée un graphique hexbin. C'est un nuage de points où des bacs hexagonaux sont utilisés à la place des points de données individuels, et la couleur de chaque bac indique combien de points de données y tombent.

Comme d'habitude, n'hésitez pas à explorer plus de paramètres dans la documentation.

Tâche

Swipe to start coding

  1. Utilisez la fonction correcte pour créer un graphique conjoint.
  2. Utilisez weather_df comme données pour le graphique (le premier argument).
  3. Définissez la colonne 'Boston' pour la variable de l'axe des x (le deuxième argument).
  4. Définissez la colonne 'Seattle' pour la variable de l'axe des y (le troisième argument).
  5. Définissez le graphique au milieu pour avoir une ligne de régression (l'argument le plus à droite).

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 5
Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
We're sorry to hear that something went wrong. What happened?
some-alt