ggplot2 ECDF graphique: Guide de démarrage rapide pour la fonction de répartition empirique - Logiciel R et visualisation de données


Ce tutoriel R décrit comment créer un graphique ECDF (ou Empirical Cumulative Density Function) en utilisant le logiciel R et le package ggplot2. ECDF se traduit en français comme étant la fonction de répartition empirique. Pour un nombre donné, la fonction ECDF renvoie le pourcentage des observations qui sont inférieurs à ce seuil.

La fonction stat_ecdf() peut être utilisée.

Créer des données

Poids de 200 personnes en pouces ( 1 pouce = 2.5 cm) :

set.seed(1234)
df <- data.frame(height = round(rnorm(200, mean=60, sd=15)))
head(df)
##   height
## 1     42
## 2     64
## 3     76
## 4     25
## 5     66
## 6     68

Graphiques ECDF

library(ggplot2)
ggplot(df, aes(height)) + stat_ecdf(geom = "point")
ggplot(df, aes(height)) + stat_ecdf(geom = "step")

Pour une valeur donnée, par exemple height = 50, vous pouvez constater qu’environ 25% des individus sont plus petits que 50 pouces.

Graphique ECDF personnalisé

# Basic ECDF plot
ggplot(df, aes(height)) + stat_ecdf(geom = "step")+
labs(title="Empirical Cumulative \n Density Function",
     y = "F(height)", x="Height in inch")+
theme_classic()

Infos

Cette analyse a été faite en utilisant le logiciel R (ver. 3.2.4) et le package ggplot2 (ver. 2.1.0)


Enjoyed this article? I’d be very grateful if you’d help it spread by emailing it to a friend, or sharing it on Twitter, Facebook or Linked In.

Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Avez vous aimé cet article? Je vous serais très reconnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami ou en le partageant sur Twitter, Facebook ou Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!






Cette page a été vue 7300 fois