Gráfico de Dispersão
Um gráfico de dispersão é um tipo de gráfico que exibe a relação entre duas variáveis (x e y) utilizando pontos ou outros marcadores.
Gráficos de dispersão são uma das ferramentas mais simples para examinar visualmente se duas variáveis estão correlacionadas. Embora não seja o método mais preciso, frequentemente fornece uma visão útil de forma rápida.
É semelhante a um gráfico de linhas, exceto pelo fato de não possuir linhas, apenas marcadores. Para criar um gráfico de dispersão, basta utilizar a função scatter()
do pyplot
, passando primeiro os valores para o eixo x e depois os valores para o eixo y. Veja um exemplo:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
A sintaxe da função scatter()
se assemelha à da plot()
. No entanto, ao contrário da plot()
, é sempre necessário fornecer valores para ambos os parâmetros x
e y
.
Neste exemplo, y
é calculado usando a fórmula y = 2x + 5
. O gráfico de dispersão mostra uma relação linear positiva — à medida que x
aumenta, y
também aumenta, e o inverso também ocorre.
Também é possível definir outros marcadores em vez de pontos e ajustar seu tamanho usando os parâmetros marker
e s
, respectivamente:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Aqui, marcadores 'x'
foram usados em vez do padrão 'o'
(pontos), e seu tamanho foi definido como 100. É possível ajustar o parâmetro s
para explorar diferentes tamanhos de marcadores.
A próxima seção abordará mais a personalização de gráficos, mas, por enquanto, você pode utilizar a documentação da função scatter()
para explorar mais.
A plotagem de múltiplos gráficos de dispersão pode ser realizada simplesmente chamando a função scatter()
duas vezes com diferentes argumentos x
e y
(de forma semelhante aos gráficos de linha).
Embora plt.plot(x, y, 'o')
e plt.scatter(x, y)
possam parecer semelhantes à primeira vista, eles têm finalidades diferentes:
plt.plot(x, y, 'o')
é uma função de gráfico de linha usando'o'
para exibir apenas marcadores. É rápida, mas oferece opções limitadas de estilo.plt.scatter(x, y)
é uma função dedicada para gráfico de dispersão que fornece mais controle — permitindo a personalização individual do tamanho, cor e transparência dos marcadores.
Swipe to start coding
Exibir uma relação quadrática entre duas variáveis utilizando um gráfico de dispersão:
- Substitua os sublinhados, de modo que o array
y
contenha os elementos do arrayx
elevados ao quadrado. - Utilize a função correta para criar um gráfico de dispersão.
- Passe
x
ey
para essa função na ordem correta. - Defina o tamanho dos marcadores como 70.
Solução
Obrigado pelo seu feedback!