ggplot2 ECDF graphique: Guide de démarrage rapide pour la fonction de répartition empirique - Logiciel R et visualisation de données


Ce tutoriel R décrit comment créer un graphique ECDF (ou Empirical Cumulative Density Function) en utilisant le logiciel R et le package ggplot2. ECDF se traduit en français comme étant la fonction de répartition empirique. Pour un nombre donné, la fonction ECDF renvoie le pourcentage des observations qui sont inférieurs à ce seuil.

La fonction stat_ecdf() peut être utilisée.

Créer des données

Poids de 200 personnes en pouces ( 1 pouce = 2.5 cm) :

set.seed(1234)
df <- data.frame(height = round(rnorm(200, mean=60, sd=15)))
head(df)
##   height
## 1     42
## 2     64
## 3     76
## 4     25
## 5     66
## 6     68

Graphiques ECDF

library(ggplot2)
ggplot(df, aes(height)) + stat_ecdf(geom = "point")
ggplot(df, aes(height)) + stat_ecdf(geom = "step")

Pour une valeur donnée, par exemple height = 50, vous pouvez constater qu’environ 25% des individus sont plus petits que 50 pouces.

Graphique ECDF personnalisé

# Basic ECDF plot
ggplot(df, aes(height)) + stat_ecdf(geom = "step")+
labs(title="Empirical Cumulative \n Density Function",
     y = "F(height)", x="Height in inch")+
theme_classic()

Infos

Cette analyse a été faite en utilisant le logiciel R (ver. 3.2.4) et le package ggplot2 (ver. 2.1.0)









Want to Learn More on R Programming and Data Science?

Follow us by Email

by FeedBurner

On Social Networks:


 Get involved :
  Click to follow us on and Google+ :   
  Comment this article by clicking on "Discussion" button (top-right position of this page)
  Sign up as a member and post news and articles on STHDA web site.
Cette page a été vue 6977 fois