ggplot2 qq plot (quantile - quantile plot) : Guide de d?marrage rapide - Logiciel R et visualisation de donn?es


Ce tutoriel R d?crit comment faire qq plot (ou quantile-quantile plot) avec le logiciel R et le package ggplot2. Le QQ plot est utilis? pour v?rifier si une s?rie de donn?es suit la distribution normale.

La fonction stat_qq() ou qplot() peut ?tre utilis?e.

ggplot2 qq plot - Logiciel R et visualisation de donn?es

Preparer les donn?es

Le jeu de donn?e mtcars est utilis? dans les exemples ci-dessous.

# Convertir la colonne cyl en facteur
mtcars$cyl <- as.factor(mtcars$cyl)
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

QQ plots basiques

Dans l?exemple ci-dessous, la distribution de la variable mpg est explor?e:

library(ggplot2)
# Solution 1
qplot(sample = mpg, data = mtcars)
# Solution 2
ggplot(mtcars, aes(sample=mpg))+stat_qq()

ggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?es

Changer la forme des points du qq plot par groupe

Dans le code R ci-dessous, la forme des points est automatiquement contr?l?e par la variable cyl.

Vous pouvez ?galement d?finir la forme des points manuellement en utilisant la fonction scale_shape_manual().

# Changer la forme des points par groupes
p<-qplot(sample = mpg, data = mtcars, shape=cyl)
p
# Changer manuellement la forme des points
p + scale_shape_manual(values=c(1,17,19))

ggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?es

Lire plus sur les types de points : ggplot2 types de points

Changer la couleur par groupes

Dans le code R ci-dessous, la couleur des points est automatiquement contr?l?e par les niveaux de la variable cyl:

# Changer la couleur par groupe
p<-qplot(sample = mpg, data = mtcars, color=cyl)
p

ggplot2 qq plot - Logiciel R et visualisation de donn?es

Il est aussi possible de changer manuellement les couleurs en utilisant les fonctions:

  • scale_color_manual() : pour utiliser des couleurs personnalis?es
  • scale_color_brewer() : pour utiliser les palettes de couleurs du package RColorBrewer
  • scale_color_grey() : pour utiliser la palette de couleurs grises
# Utiliser des couleurs personnalis?es
p+scale_color_manual(values=c("#999999", "#E69F00", "#56B4E9"))
# Utiliser les palettes RColorBrewer
p+scale_color_brewer(palette="Dark2")
# Utiliser la palette de couleurs grises
p + scale_color_grey() + theme_classic()

ggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?es

Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs

Changer la position de la l?gende

p + theme(legend.position="top")
p + theme(legend.position="bottom")
p + theme(legend.position="none") # Remove legend

ggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?es

Les valeurs possibles pour l?argument legend.position sont : ?left?,?top?, ?right?, ?bottom?.

Lire plus sur ggplot2 et l?gende: ggplot2 l?gende

QQ plots personnalis?s

# qq plot basique
qplot(sample = mpg, data = mtcars)+
labs(title="Miles per gallon \n according to the weight",
       y = "Miles/(US) gallon")+
theme_classic()
# Changer la couleur et le type de points par groupes
p <- qplot(sample = mpg, data = mtcars, color=cyl, shape=cyl)+
labs(title="Miles per gallon \n according to the weight",
       y = "Miles/(US) gallon")
p + theme_classic()

ggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?es

Changer les couleurs manuellement:

# Couleurs continues
p + scale_color_brewer(palette="Blues") + theme_classic()
# Couleurs discretes
p + scale_color_brewer(palette="Dark2") + theme_minimal()
# Gradient de couleurs
p + scale_color_brewer(palette="RdBu")

ggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?esggplot2 qq plot - Logiciel R et visualisation de donn?es

Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs

Infos

Cette analyse a ?t? faite en utilisant le logiciel R (ver. 3.1.2) et le package ggplot2 (ver. 1.0.0)


Enjoyed this article? I’d be very grateful if you’d help it spread by emailing it to a friend, or sharing it on Twitter, Facebook or Linked In.

Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Avez vous aimé cet article? Je vous serais très reconnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami ou en le partageant sur Twitter, Facebook ou Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!





Cette page a été vue 3552 fois
Licence - Pas d?Utilisation Commerciale - Partage dans les M?mes Conditions
Licence Creative Commons