ggplot2 qq plot (quantile - quantile plot) : Guide de démarrage rapide - Logiciel R et visualisation de données


Ce tutoriel R décrit comment faire qq plot (ou quantile-quantile plot) avec le logiciel R et le package ggplot2. Le QQ plot est utilisé pour vérifier si une série de données suit la distribution normale.

La fonction stat_qq() ou qplot() peut être utilisée.

ggplot2 qq plot - Logiciel R et visualisation de données

Preparer les données

Le jeu de donnée mtcars est utilisé dans les exemples ci-dessous.

# Convertir la colonne cyl en facteur
mtcars$cyl <- as.factor(mtcars$cyl)
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

QQ plots basiques

Dans l’exemple ci-dessous, la distribution de la variable mpg est explorée:

library(ggplot2)
# Solution 1
qplot(sample = mpg, data = mtcars)
# Solution 2
ggplot(mtcars, aes(sample=mpg))+stat_qq()

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Changer la forme des points du qq plot par groupe

Dans le code R ci-dessous, la forme des points est automatiquement contrôlée par la variable cyl.

Vous pouvez également définir la forme des points manuellement en utilisant la fonction scale_shape_manual().

# Changer la forme des points par groupes
p<-qplot(sample = mpg, data = mtcars, shape=cyl)
p
# Changer manuellement la forme des points
p + scale_shape_manual(values=c(1,17,19))

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Lire plus sur les types de points : ggplot2 types de points

Changer la couleur par groupes

Dans le code R ci-dessous, la couleur des points est automatiquement contrôlée par les niveaux de la variable cyl:

# Changer la couleur par groupe
p<-qplot(sample = mpg, data = mtcars, color=cyl)
p

ggplot2 qq plot - Logiciel R et visualisation de données

Il est aussi possible de changer manuellement les couleurs en utilisant les fonctions:

  • scale_color_manual() : pour utiliser des couleurs personnalisées
  • scale_color_brewer() : pour utiliser les palettes de couleurs du package RColorBrewer
  • scale_color_grey() : pour utiliser la palette de couleurs grises
# Utiliser des couleurs personnalisées
p+scale_color_manual(values=c("#999999", "#E69F00", "#56B4E9"))
# Utiliser les palettes RColorBrewer
p+scale_color_brewer(palette="Dark2")
# Utiliser la palette de couleurs grises
p + scale_color_grey() + theme_classic()

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs

Changer la position de la légende

p + theme(legend.position="top")
p + theme(legend.position="bottom")
p + theme(legend.position="none") # Remove legend

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Les valeurs possibles pour l’argument legend.position sont : “left”,“top”, “right”, “bottom”.

Lire plus sur ggplot2 et légende: ggplot2 légende

QQ plots personnalisés

# qq plot basique
qplot(sample = mpg, data = mtcars)+
labs(title="Miles per gallon \n according to the weight",
       y = "Miles/(US) gallon")+
theme_classic()
# Changer la couleur et le type de points par groupes
p <- qplot(sample = mpg, data = mtcars, color=cyl, shape=cyl)+
labs(title="Miles per gallon \n according to the weight",
       y = "Miles/(US) gallon")
p + theme_classic()

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Changer les couleurs manuellement:

# Couleurs continues
p + scale_color_brewer(palette="Blues") + theme_classic()
# Couleurs discretes
p + scale_color_brewer(palette="Dark2") + theme_minimal()
# Gradient de couleurs
p + scale_color_brewer(palette="RdBu")

ggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de donnéesggplot2 qq plot - Logiciel R et visualisation de données

Lire plus sur ggplot2 et les couleurs ici: ggplot2 couleurs

Infos

Cette analyse a été faite en utilisant le logiciel R (ver. 3.1.2) et le package ggplot2 (ver. 1.0.0)







Want to Learn More on R Programming and Data Science?

==> Subscribe to our Mailing List <==

* indicates required


 Get involved :
  Click to follow us on and Google+ :   
  Comment this article by clicking on "Discussion" button (top-right position of this page)
  Sign up as a member and post news and articles on STHDA web site.


Suggestions


ggplot2 couleurs : Changer les couleurs automatiquement et manuellement - Logiciel R et visualisation de données
ggplot2 graduation des axes : Guide pour personnaliser les étiquettes des graduations - Logiciel R et visualisation de données
ggplot2 légende : Modifier facilement la légende d'un graphique - Logiciel R et visualisation de données
ggplot2 barplots : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 échelle et transformation des axes - Logiciel R et visualisation de données
ggplot2 - Combiner plusieurs graphiques sur la même page - Logiciel R et visualisation de données
ggplot2 titres : Titre principal, titre des axes et légendes - Logiciel R et visualisation de données
ggplot2 box plot : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 nuage de points: Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 textes : Ajouter du texte à un graphique - Logiciel R et visualisation de données
ggplot2 thèmes et couleurs de fond : les 3 éléments - Logiciel R et visualisation de données
ggplot2 barres d'erreur : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 graphique en camembert: Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 types de points - Logiciel R et visualisation de données
ggplot2 histogramme : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 - ajouter une ligne droite à un graphe : Ligne horizontale, verticale et droite de régression
ggplot2 graphique linéaire : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2
ggplot2 dot plot : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 : heatmap d'une matrice de corrélation - Logiciel R et visualisation de données
ggplot2 type de traits : Comment changer le type de trait d'un graphique avec le logiciel R?
ggplot2 facet : diviser un graphique en plusieurs panneaux - Logiciel R et visualisation de données
ggplot2 ECDF graphique: Guide de démarrage rapide pour la fonction de répartition empirique - Logiciel R et visualisation de données
ggplot2 violin plot : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 courbe de distribution : Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 stripchart (jitter): Guide de démarrage rapide - Logiciel R et visualisation de données
ggplot2 pivoter un graphique : Inverser et retourner le graphique - Logiciel R et visualisation de données

Cette page a été vue 2389 fois
Licence - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions
Licence Creative Commons