Statistiques Descriptives
Comprendre vos données commence par les statistiques descriptives : elles fournissent des résumés essentiels sur la distribution, la tendance centrale et la dispersion des variables.
Statistiques descriptives de base
Les mesures statistiques les plus courantes sont :
- Moyenne : valeur moyenne ;
- Écart type : mesure de la dispersion autour de la moyenne ;
- Médiane : valeur centrale ;
- Min / max : valeurs minimale et maximale.
Ces mesures offrent un aperçu rapide de la distribution de vos variables.
Base R
R de base propose des fonctions simples pour calculer des statistiques descriptives. La fonction summary() fournit également un aperçu statistique rapide de toutes les colonnes numériques.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Avec dplyr, il est possible d'utiliser summarise() pour calculer plusieurs statistiques en une seule fois dans un format clair et lisible.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 4
Statistiques Descriptives
Glissez pour afficher le menu
Comprendre vos données commence par les statistiques descriptives : elles fournissent des résumés essentiels sur la distribution, la tendance centrale et la dispersion des variables.
Statistiques descriptives de base
Les mesures statistiques les plus courantes sont :
- Moyenne : valeur moyenne ;
- Écart type : mesure de la dispersion autour de la moyenne ;
- Médiane : valeur centrale ;
- Min / max : valeurs minimale et maximale.
Ces mesures offrent un aperçu rapide de la distribution de vos variables.
Base R
R de base propose des fonctions simples pour calculer des statistiques descriptives. La fonction summary() fournit également un aperçu statistique rapide de toutes les colonnes numériques.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Avec dplyr, il est possible d'utiliser summarise() pour calculer plusieurs statistiques en une seule fois dans un format clair et lisible.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Merci pour vos commentaires !