ggplot2 qq plot (quantile - quantile plot) : Guide de démarrage rapide - Logiciel R et visualisation de données


Ce tutoriel R décrit comment faire qq plot (ou quantile-quantile plot) avec le logiciel R et le package ggplot2. Le QQ plot est utilisé pour vérifier si une série de données suit la distribution normale.

La fonction stat_qq() ou qplot() peut être utilisée.

ggplot2 qq plot - Logiciel R et visualisation de données

Preparer les données

Le jeu de donnée mtcars est utilisé dans les exemples ci-dessous.

# Convertir la colonne cyl en facteur
mtcars$cyl <- as.factor(mtcars$cyl)
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

QQ plots basiques

Dans l’exemple ci-dessous, la distribution de la variable mpg est explorée:

library(ggplot2)
# Solution 1
qplot(sample = mpg, data = mtcars)
# Solution 2
ggplot(mtcars, aes(sample=mpg))+stat_qq()

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Changer la forme des points du qq plot par groupe

Dans le code R ci-dessous, la forme des points est automatiquement contrôlée par la variable cyl.

Vous pouvez également définir la forme des points manuellement en utilisant la fonction scale_shape_manual().

# Changer la forme des points par groupes
p<-qplot(sample = mpg, data = mtcars, shape=cyl)
p
# Changer manuellement la forme des points
p + scale_shape_manual(values=c(1,17,19))

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Lire plus sur les types de points : ggplot2 types de points

Changer la couleur par groupes

Dans le code R ci-dessous, la couleur des points est automatiquement contrôlée par les niveaux de la variable cyl:

# Changer la couleur par groupe
p<-qplot(sample = mpg, data = mtcars, color=cyl)
p

ggplot2 qq plot - Logiciel R et visualisation de données

Il est aussi possible de changer manuellement les couleurs en utilisant les fonctions:

  • scale_color_manual() : pour utiliser des couleurs personnalisées
  • scale_color_brewer() : pour utiliser les palettes de couleurs du package RColorBrewer
  • scale_color_grey() : pour utiliser la palette de couleurs grises
# Utiliser des couleurs personnalisées
p+scale_color_manual(values=c("#999999", "#E69F00", "#56B4E9"))
# Utiliser les palettes RColorBrewer
p+scale_color_brewer(palette="Dark2")
# Utiliser la palette de couleurs grises
p + scale_color_grey() + theme_classic()

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs

Changer la position de la légende

p + theme(legend.position="top")
p + theme(legend.position="bottom")
p + theme(legend.position="none") # Remove legend

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Les valeurs possibles pour l’argument legend.position sont : “left”,“top”, “right”, “bottom”.

Lire plus sur ggplot2 et légende: ggplot2 légende

QQ plots personnalisés

# qq plot basique
qplot(sample = mpg, data = mtcars)+
labs(title="Miles per gallon \n according to the weight",
       y = "Miles/(US) gallon")+
theme_classic()
# Changer la couleur et le type de points par groupes
p <- qplot(sample = mpg, data = mtcars, color=cyl, shape=cyl)+
labs(title="Miles per gallon \n according to the weight",
       y = "Miles/(US) gallon")
p + theme_classic()

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Changer les couleurs manuellement:

# Couleurs continues
p + scale_color_brewer(palette="Blues") + theme_classic()
# Couleurs discretes
p + scale_color_brewer(palette="Dark2") + theme_minimal()
# Gradient de couleurs
p + scale_color_brewer(palette="RdBu")

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs

Infos

Cette analyse a été faite en utilisant le logiciel R (ver. 3.1.2) et le package ggplot2 (ver. 1.0.0)


Enjoyed this article? I’d be very grateful if you’d help it spread by emailing it to a friend, or sharing it on Twitter, Facebook or Linked In.

Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Avez vous aimé cet article? Je vous serais très reconnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami ou en le partageant sur Twitter, Facebook ou Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!






Cette page a été vue 4090 fois