Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Spreidingsdiagrammen Maken | Datavisualisatie
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Data-analyse met R

bookSpreidingsdiagrammen Maken

Waarom scatterplots gebruiken?

Een scatterplot is ideaal voor het visualiseren van relaties tussen variabelen. Het kan worden gebruikt om:

  • Relaties tussen twee numerieke variabelen weer te geven;
  • Patronen, clusters of uitschieters te detecteren;
  • Correlatie (positief/negatief/geen) te onderzoeken.

Scatterplot-syntaxis in ggplot2

Een scatterplot kan worden gemaakt met geom_point(). Specificeer hiervoor de esthetiek voor zowel de x- als de y-as.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

Om groepen binnen de data te onderscheiden, kan een groepsvariabele worden toegevoegd aan de color-esthetiek. Hierdoor krijgen de verschillende groepen een andere kleur, waardoor patronen beter zichtbaar worden.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Voorbeeld: Verkoopprijs vs. gereden kilometers

Een scatterplot kan worden gebruikt om te onderzoeken hoe het gebruik van een auto zich verhoudt tot de verkoopprijs. In dit voorbeeld toont de x-as het aantal gereden kilometers, terwijl de y-as de verkoopprijs weergeeft.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Deze visualisatie laat vaak afschrijvingstrends zien – naarmate het aantal kilometers toeneemt, daalt de verkoopprijs doorgaans. Ook kunnen uitschieters zichtbaar worden, zoals auto's met een ongewoon hoge prijs ondanks een hoge kilometerstand.

question mark

Welke ggplot2-functie maakt een spreidingsdiagram?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

bookSpreidingsdiagrammen Maken

Veeg om het menu te tonen

Waarom scatterplots gebruiken?

Een scatterplot is ideaal voor het visualiseren van relaties tussen variabelen. Het kan worden gebruikt om:

  • Relaties tussen twee numerieke variabelen weer te geven;
  • Patronen, clusters of uitschieters te detecteren;
  • Correlatie (positief/negatief/geen) te onderzoeken.

Scatterplot-syntaxis in ggplot2

Een scatterplot kan worden gemaakt met geom_point(). Specificeer hiervoor de esthetiek voor zowel de x- als de y-as.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

Om groepen binnen de data te onderscheiden, kan een groepsvariabele worden toegevoegd aan de color-esthetiek. Hierdoor krijgen de verschillende groepen een andere kleur, waardoor patronen beter zichtbaar worden.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Voorbeeld: Verkoopprijs vs. gereden kilometers

Een scatterplot kan worden gebruikt om te onderzoeken hoe het gebruik van een auto zich verhoudt tot de verkoopprijs. In dit voorbeeld toont de x-as het aantal gereden kilometers, terwijl de y-as de verkoopprijs weergeeft.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Deze visualisatie laat vaak afschrijvingstrends zien – naarmate het aantal kilometers toeneemt, daalt de verkoopprijs doorgaans. Ook kunnen uitschieters zichtbaar worden, zoals auto's met een ongewoon hoge prijs ondanks een hoge kilometerstand.

question mark

Welke ggplot2-functie maakt een spreidingsdiagram?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 5
some-alt