ggplot2 violin plot : Guide de démarrage rapide - Logiciel R et visualisation de données
- Préparer les données
- Violins-plots basiques
- Ajouter des statistiques descriptives sur un violin plot
- Violin plot avec des points
- Changer la couleur des violins-plots par groupes
- Changer la position de la légende
- Changer l’ordre des éléments dans la légende
- Violin plot avec plusieurs groupes
- Violins-plots personnalisés
- Infos
Ce tutoriel R décrit comment créer un violin plot avec le logiciel R et le package ggplot2.
Les violins-plots sont similaires aux box plots, excepté qu’ils permettent de montrer la courbe de densité de probabilité des différentes valeurs. Typiquement, les violins-plots présentent un marqueur pour la médiane des données et l’écart interquartile, comme dans un box plot standard.
La fonction geom_violin() est utilisée pour faire un violin plot.
Préparer les données
Le jeu de données ToothGrowth est utilisé dans les exemples suivants :
# Convertir la colonne dose en facteur
ToothGrowth$dose <- as.factor(ToothGrowth$dose)
head(ToothGrowth)
## len supp dose
## 1 4.2 VC 0.5
## 2 11.5 VC 0.5
## 3 7.3 VC 0.5
## 4 5.8 VC 0.5
## 5 6.4 VC 0.5
## 6 10.0 VC 0.5
Assurez-vous que la variable dose soit convertie en facteur en utilisant le script de R ci-dessus.
Violins-plots basiques
library(ggplot2)
# Violin plot basic
p <- ggplot(ToothGrowth, aes(x=dose, y=len)) +
geom_violin()
p
# Tourner le violin plot
p + coord_flip()
# Utiliser l'argument trim = FALSE
ggplot(ToothGrowth, aes(x=dose, y=len)) +
geom_violin(trim=FALSE)
Notez que par défaut trim = TRUE. Dans ce cas, la queue des violons est gommée.
Choisir les groupes à afficher:
p + scale_x_discrete(limits=c("0.5", "2"))
Ajouter des statistiques descriptives sur un violin plot
La fonction stat_summary() peut être utilisée pour ajouter la moyenne/médiane et plus sur un violin plot.
Ajouter le point de la moyenne et de la médiane
# violin plot avec le point de la moyenne
p + stat_summary(fun.y=mean, geom="point", shape=23, size=2)
# violin plot avec le point de la médiane
p + stat_summary(fun.y=median, geom="point", size=2, color="red")
Ajouter la médiane et les quartiles
Une solution est d’utiliser la fonction geom_boxplot :
p + geom_boxplot(width=0.1)
Ajouter la moyenne et l’écart type
La fonction mean_sdl est utilisée. mean_sdl calcule la moyenne plus ou moins une constante fois l’écart type.
Dans le code R ci-dessous, la constante est spécifiée en utilisant l’argument mult (mult = 1). Par défaut mult = 2.
La moyenne +/- SD peut être ajoutée comme un crossbar ou un pointrange :
p <- ggplot(ToothGrowth, aes(x=dose, y=len)) +
geom_violin(trim=FALSE)
p + stat_summary(fun.data="mean_sdl", mult=1,
geom="crossbar", width=0.2 )
p + stat_summary(fun.data=mean_sdl, mult=1,
geom="pointrange", color="red")
Notez que, vous pouvez aussi définir une fonction personnalisée pour calculer les statistiques descriptives comme suit:
# Fonction pour produire les
# statistiques descriptives (moyenne et +/- sd)
data_summary <- function(x) {
m <- mean(x)
ymin <- m-sd(x)
ymax <- m+sd(x)
return(c(y=m,ymin=ymin,ymax=ymax))
}
Utiliser une fonction personnalisée :
p + stat_summary(fun.data=data_summary)
Violin plot avec des points
Des points peuvent être ajoutés à un violin plot en utilisant la fonction geom_dotplot() ou geom_jitter() :
# violin plot avec un dot plot
p + geom_dotplot(binaxis='y', stackdir='center', dotsize=1)
# Violin plot avec des points dispersés (jitter)
# 0.2 : dégré de dispersion sur l'axe des x
p + geom_jitter(shape=16, position=position_jitter(0.2))
Changer la couleur des violins-plots par groupes
Changer la couleur des traits des violins-plots
La couleur des traits du violin plot peut être automatiquement contrôlée par les niveaux de la variable dose:
# Changer la couleur des traits du violin plot par groupes
p<-ggplot(ToothGrowth, aes(x=dose, y=len, color=dose)) +
geom_violin(trim=FALSE)
p
Il est aussi possible de changer manuellement la couleur des traits du violin plot en utilisant les fonctions:
- scale_color_manual() : pour utiliser des couleurs personnalisées
- scale_color_brewer() : pour utiliser les palettes de couleurs du package RColorBrewer
- scale_color_grey() : pour utiliser la palette de couleurs grises
# Utiliser des couleurs personnalisées
p+scale_color_manual(values=c("#999999", "#E69F00", "#56B4E9"))
# Utiliser les palettes RColorBrewer
p+scale_color_brewer(palette="Dark2")
# Utiliser la palette de couleurs grises
p + scale_color_grey() + theme_classic()
Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs
Changer les couleurs de remplissage du violin plot
Dans le code R ci-dessous, les couleurs de remplissage du violin plot sont automatiquement contrôlées par les niveaux de la variable dose:
# Utiliser une couleur unique
ggplot(ToothGrowth, aes(x=dose, y=len)) +
geom_violin(trim=FALSE, fill='#A4A4A4', color="darkred")+
geom_boxplot(width=0.1) + theme_minimal()
# Changer la couleur par groupes
p<-ggplot(ToothGrowth, aes(x=dose, y=len, fill=dose)) +
geom_violin(trim=FALSE)
p
Il est aussi possible de changer manuellement les couleurs de remplissage du violin plot en utilisant les fonctions:
- scale_fill_manual() : pour utiliser des couleurs personnalisées
- scale_fill_brewer() : pour utiliser les palettes de couleurs du package RColorBrewer
- scale_fill_grey() : pour utiliser la palette de couleurs grises
# Utiliser des couleurs personnalisées
p+scale_fill_manual(values=c("#999999", "#E69F00", "#56B4E9"))
# Utiliser les palettes RColorBrewer
p+scale_fill_brewer(palette="Dark2")
# Utiliser la palette de couleurs grises
p + scale_fill_grey() + theme_classic()
Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs
Changer la position de la légende
p + theme(legend.position="top")
p + theme(legend.position="bottom")
p + theme(legend.position="none") # supprimer la légende
Les valeurs possibles pour l’argument legend.position sont : “left”,“top”, “right”, “bottom”.
Lire plus sur ggplot2 et légende: ggplot2 légende
Changer l’ordre des éléments dans la légende
La fonction scale_x_discrete peut être utilisée pour changer l’ordre des éléments en “2”, “0.5”, “1” :
p + scale_x_discrete(limits=c("2", "0.5", "1"))
Violin plot avec plusieurs groupes
# Changer la couleur des violins-plots par groupe
ggplot(ToothGrowth, aes(x=dose, y=len, fill=supp)) +
geom_violin()
# Changer la position
p<-ggplot(ToothGrowth, aes(x=dose, y=len, fill=supp)) +
geom_violin(position=position_dodge(1))
p
Changer la couleur des violins-plots et ajouter des points :
# Ajouter des points
p + geom_dotplot(binaxis='y', stackdir='center',
position=position_dodge(1))
# Changer les couleurs
p+scale_fill_manual(values=c("#999999", "#E69F00", "#56B4E9"))
Violins-plots personnalisés
# Violin plot basique
ggplot(ToothGrowth, aes(x=dose, y=len)) +
geom_violin(trim=FALSE, fill="gray")+
labs(title="Plot of length by dose",x="Dose (mg)", y = "Length")+
geom_boxplot(width=0.1)+
theme_classic()
# Changer autumatiquement la couleur par groupes
dp <- ggplot(ToothGrowth, aes(x=dose, y=len, fill=dose)) +
geom_violin(trim=FALSE)+
geom_boxplot(width=0.1, fill="white")+
labs(title="Plot of length by dose",x="Dose (mg)", y = "Length")
dp + theme_classic()
Changer les couleurs de remplissage manuellement:
# Couleurs continues
dp + scale_fill_brewer(palette="Blues") + theme_classic()
# Couleurs discretes
dp + scale_fill_brewer(palette="Dark2") + theme_minimal()
# Gradient de couleurs
dp + scale_fill_brewer(palette="RdBu") + theme_minimal()
Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs
Infos
Cette analyse a été faite en utilisant le logiciel R (ver. 3.1.2) et le package ggplot2 (ver. 1.0.0)
Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!