ggplot2 qq plot (quantile - quantile plot) : Guide de démarrage rapide - Logiciel R et visualisation de données
Ce tutoriel R décrit comment faire qq plot (ou quantile-quantile plot) avec le logiciel R et le package ggplot2. Le QQ plot est utilisé pour vérifier si une série de données suit la distribution normale.
La fonction stat_qq() ou qplot() peut être utilisée.
Preparer les données
Le jeu de donnée mtcars est utilisé dans les exemples ci-dessous.
# Convertir la colonne cyl en facteur
mtcars$cyl <- as.factor(mtcars$cyl)
head(mtcars)
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
QQ plots basiques
Dans l’exemple ci-dessous, la distribution de la variable mpg est explorée:
library(ggplot2)
# Solution 1
qplot(sample = mpg, data = mtcars)
# Solution 2
ggplot(mtcars, aes(sample=mpg))+stat_qq()
Changer la forme des points du qq plot par groupe
Dans le code R ci-dessous, la forme des points est automatiquement contrôlée par la variable cyl.
Vous pouvez également définir la forme des points manuellement en utilisant la fonction scale_shape_manual().
# Changer la forme des points par groupes
p<-qplot(sample = mpg, data = mtcars, shape=cyl)
p
# Changer manuellement la forme des points
p + scale_shape_manual(values=c(1,17,19))
Lire plus sur les types de points : ggplot2 types de points
Changer la couleur par groupes
Dans le code R ci-dessous, la couleur des points est automatiquement contrôlée par les niveaux de la variable cyl:
# Changer la couleur par groupe
p<-qplot(sample = mpg, data = mtcars, color=cyl)
p
Il est aussi possible de changer manuellement les couleurs en utilisant les fonctions:
- scale_color_manual() : pour utiliser des couleurs personnalisées
- scale_color_brewer() : pour utiliser les palettes de couleurs du package RColorBrewer
- scale_color_grey() : pour utiliser la palette de couleurs grises
# Utiliser des couleurs personnalisées
p+scale_color_manual(values=c("#999999", "#E69F00", "#56B4E9"))
# Utiliser les palettes RColorBrewer
p+scale_color_brewer(palette="Dark2")
# Utiliser la palette de couleurs grises
p + scale_color_grey() + theme_classic()
Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs
Changer la position de la légende
p + theme(legend.position="top")
p + theme(legend.position="bottom")
p + theme(legend.position="none") # Remove legend
Les valeurs possibles pour l’argument legend.position sont : “left”,“top”, “right”, “bottom”.
Lire plus sur ggplot2 et légende: ggplot2 légende
QQ plots personnalisés
# qq plot basique
qplot(sample = mpg, data = mtcars)+
labs(title="Miles per gallon \n according to the weight",
y = "Miles/(US) gallon")+
theme_classic()
# Changer la couleur et le type de points par groupes
p <- qplot(sample = mpg, data = mtcars, color=cyl, shape=cyl)+
labs(title="Miles per gallon \n according to the weight",
y = "Miles/(US) gallon")
p + theme_classic()
Changer les couleurs manuellement:
# Couleurs continues
p + scale_color_brewer(palette="Blues") + theme_classic()
# Couleurs discretes
p + scale_color_brewer(palette="Dark2") + theme_minimal()
# Gradient de couleurs
p + scale_color_brewer(palette="RdBu")
Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs
Infos
Cette analyse a été faite en utilisant le logiciel R (ver. 3.1.2) et le package ggplot2 (ver. 1.0.0)
Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!