 Histogrammien Luominen
Histogrammien Luominen
Miksi käyttää histogrammeja?
Histogrammit havainnollistavat jatkuvan (numeerisen) datan jakaumaa. Ne näyttävät, miten data jakautuu alueisiin (luokkiin) ja auttavat:
- Havaitsemaan vinouman, poikkeavat arvot tai aukot;
- Ymmärtämään frekvenssijakauman;
- Arvioimaan nopeasti, onko data normaalijakautunutta vai ei.
Parhaiten soveltuvat muuttujille kuten hinta, ajokilometrit tai ikä.
Histogrammin syntaksi ggplot2:ssa
Histogrammin voi luoda käyttämällä geom_histogram(), jossa x-muuttujan tulee olla numeerinen.
ggplot(data = df, aes(x = variable)) +
  geom_histogram()
Histogrammin ulkoasua voi muokata argumenteilla kuten bins (luokkien määrä), fill (palkkien väri), color (reunojen väri) ja theme tyylin määrittelyyn.
Esimerkki: Myyntihintojen jakauma
Histogrammia voidaan käyttää tarkastelemaan, miten automyyntihinnat jakautuvat aineistossa. Tässä esimerkissä palkit täytetään teräksen sinisellä ja reunustetaan mustalla, ja selkeyden vuoksi lisätään otsikot sekä minimaalinen teema.
ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()
Tämä kuvaaja paljastaa myyntihintojen jakauman yleisen muodon, jolloin on helppo nähdä, sijoittuvatko suurin osa autoista tietylle hintavälille vai esiintyykö poikkeavia arvoja ylä- tai alapäässä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between a histogram and a bar plot?
How do I choose the right number of bins for my histogram?
What does it mean if my histogram is skewed to the right or left?
Awesome!
Completion rate improved to 4 Histogrammien Luominen
Histogrammien Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää histogrammeja?
Histogrammit havainnollistavat jatkuvan (numeerisen) datan jakaumaa. Ne näyttävät, miten data jakautuu alueisiin (luokkiin) ja auttavat:
- Havaitsemaan vinouman, poikkeavat arvot tai aukot;
- Ymmärtämään frekvenssijakauman;
- Arvioimaan nopeasti, onko data normaalijakautunutta vai ei.
Parhaiten soveltuvat muuttujille kuten hinta, ajokilometrit tai ikä.
Histogrammin syntaksi ggplot2:ssa
Histogrammin voi luoda käyttämällä geom_histogram(), jossa x-muuttujan tulee olla numeerinen.
ggplot(data = df, aes(x = variable)) +
  geom_histogram()
Histogrammin ulkoasua voi muokata argumenteilla kuten bins (luokkien määrä), fill (palkkien väri), color (reunojen väri) ja theme tyylin määrittelyyn.
Esimerkki: Myyntihintojen jakauma
Histogrammia voidaan käyttää tarkastelemaan, miten automyyntihinnat jakautuvat aineistossa. Tässä esimerkissä palkit täytetään teräksen sinisellä ja reunustetaan mustalla, ja selkeyden vuoksi lisätään otsikot sekä minimaalinen teema.
ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()
Tämä kuvaaja paljastaa myyntihintojen jakauman yleisen muodon, jolloin on helppo nähdä, sijoittuvatko suurin osa autoista tietylle hintavälille vai esiintyykö poikkeavia arvoja ylä- tai alapäässä.
Kiitos palautteestasi!