Contenu du cours
Visualisation Ultime Avec Python
Visualisation Ultime Avec Python
Nuage de Points
Vous avez fait un excellent travail en apprenant les graphiques en ligne, il vous sera donc beaucoup plus facile de plonger dans les graphiques en nuage de points.
Un nuage de points est simplement un graphique qui représente une relation entre deux variables (x et y) à l'aide de points ou d'autres marqueurs. Créer un nuage de points est peut-être le moyen le plus simple de vérifier si deux variables sont corrélées (pas le plus précis, mais cela peut tout de même donner un aperçu).
Il est similaire à un graphique en ligne, sauf qu'il n'a pas de lignes, seulement des marqueurs. Pour créer un nuage de points, il vous suffit d'utiliser une fonction scatter()
de pyplot
, en passant d'abord les valeurs pour l'axe des x, puis les valeurs pour l'axe des y. Jetons un coup d'œil à un exemple :
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
La syntaxe de la fonction scatter()
ressemble à celle de plot()
. Cependant, contrairement à plot()
, vous devez toujours fournir des valeurs pour les paramètres x
et y
.
Dans notre cas, les valeurs de y sont déterminées linéairement par la formule y = 2x + 5
. Notre nuage de points illustre visuellement la relation linéaire positive entre ces deux variables : y
augmente avec l'augmentation de x
et diminue avec la diminution de x
.
Il est également possible de définir d'autres marqueurs à la place des points et de définir leur taille à l'aide des paramètres marker
et s
respectivement :
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Ici, nous avons utilisé 'x'
comme marqueurs au lieu de 'o'
(points) par défaut et avons défini leur taille à 100. N'hésitez pas à expérimenter avec le paramètre s
(taille). Nous nous concentrerons davantage sur la personnalisation des graphiques dans la section suivante, mais pour l'instant, vous pouvez utiliser la fonction scatter()
documentation pour explorer davantage.
Tracer plusieurs graphiques de dispersion peut être accompli simplement en appelant la fonction scatter()
deux fois avec différents arguments x
et y
(de manière similaire aux graphiques en ligne).
Swipe to start coding
Maintenant, vous allez afficher une relation quadratique entre deux variables à l'aide d'un graphique de dispersion :
- Remplacez les tirets bas, de sorte que le tableau
y
contienne les éléments carrés du tableaux
. - Utilisez la fonction correcte pour créer un graphique de dispersion.
- Passez
x
ety
dans cette fonction dans le bon ordre. - Définissez la taille des marqueurs à 70.
Solution
Merci pour vos commentaires !
Nuage de Points
Vous avez fait un excellent travail en apprenant les graphiques en ligne, il vous sera donc beaucoup plus facile de plonger dans les graphiques en nuage de points.
Un nuage de points est simplement un graphique qui représente une relation entre deux variables (x et y) à l'aide de points ou d'autres marqueurs. Créer un nuage de points est peut-être le moyen le plus simple de vérifier si deux variables sont corrélées (pas le plus précis, mais cela peut tout de même donner un aperçu).
Il est similaire à un graphique en ligne, sauf qu'il n'a pas de lignes, seulement des marqueurs. Pour créer un nuage de points, il vous suffit d'utiliser une fonction scatter()
de pyplot
, en passant d'abord les valeurs pour l'axe des x, puis les valeurs pour l'axe des y. Jetons un coup d'œil à un exemple :
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
La syntaxe de la fonction scatter()
ressemble à celle de plot()
. Cependant, contrairement à plot()
, vous devez toujours fournir des valeurs pour les paramètres x
et y
.
Dans notre cas, les valeurs de y sont déterminées linéairement par la formule y = 2x + 5
. Notre nuage de points illustre visuellement la relation linéaire positive entre ces deux variables : y
augmente avec l'augmentation de x
et diminue avec la diminution de x
.
Il est également possible de définir d'autres marqueurs à la place des points et de définir leur taille à l'aide des paramètres marker
et s
respectivement :
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Ici, nous avons utilisé 'x'
comme marqueurs au lieu de 'o'
(points) par défaut et avons défini leur taille à 100. N'hésitez pas à expérimenter avec le paramètre s
(taille). Nous nous concentrerons davantage sur la personnalisation des graphiques dans la section suivante, mais pour l'instant, vous pouvez utiliser la fonction scatter()
documentation pour explorer davantage.
Tracer plusieurs graphiques de dispersion peut être accompli simplement en appelant la fonction scatter()
deux fois avec différents arguments x
et y
(de manière similaire aux graphiques en ligne).
Swipe to start coding
Maintenant, vous allez afficher une relation quadratique entre deux variables à l'aide d'un graphique de dispersion :
- Remplacez les tirets bas, de sorte que le tableau
y
contienne les éléments carrés du tableaux
. - Utilisez la fonction correcte pour créer un graphique de dispersion.
- Passez
x
ety
dans cette fonction dans le bon ordre. - Définissez la taille des marqueurs à 70.
Solution
Merci pour vos commentaires !