Articles - Méthodes des Composantes Principales dans R: Guide Pratique

Packages R Réquis pour l'ACP

FactoMineR & factoextra

Il existe un certain nombre de packages R pour calculer les méthodes de composantes principales. Ces packages comprennent: FactoMineR, ade4, stats, ca, MASS et ExPosition.

Cependant, le résultat est présenté différemment selon le package utilisé.

Pour aider à l’interprétation et à la visualisation des analyses multivariées - comme le clustering et les méthodes de composantes principales - nous avons développé un package R, facile à utiliser, appelé factoextra (documentation officielle en ligne: http://www.sthda.com/english/rpkgs/factoextra) (Kassambara and Mundt 2017).

Quelque soit le package que vous décidez d’utiliser pour calculer les méthodes de composantes principales, le package factoextra peut aider à extraire facilement, dans un format lisible, les résultats d’analyse des différents packages mentionnés ci-dessus. factoextra fournit également des solutions pratiques pour créer de beaux graphiques de type ggplot2.

Dans ce livre, nous utiliserons principalement:

  • le package FactoMineR (Husson et al. 2017) pour calculer les méthodes des composantes principales;
  • et le package factoextra (Kassambara and Mundt 2017) pour extraire, visualiser et interpréter les résultats.

Les autres packages - ade4, ExPosition, etc. - seront présentés brièvement.

La figure 2.1 illustre les fonctionnalités clés de FactoMineR et de factoextra.

Fonctionnalités de FactoMineR et de factoextra pour l’analyse multivariée

Le package factoextra peut être utilisé pour visualiser le résultat des analyses suivantes:

Méthodes de composantes principales et de clustering supporté par factoextra

Installation

Installation de FactoMineR

# Installation
install.packages("FactoMineR")
# Chargement
library("FactoMineR")

Installation de factoextra

  • factoextra peut être installé à partir de CRAN comme suit:
install.packages("factoextra")
  • Ou, install la dernière version en développement à partir de Github
if(!require(devtools)) install.packages("devtools")
devtools::install_github("kassambara/factoextra")
  • Charger factoextra comme suit:
library("factoextra")

Fonctions R principales

Fonctions principales dans FactoMineR

Fonctions pour calculer les méthodes de composantes principales et pour le clustering:

Fonctions Description
PCA Principal component analysis.
CA Correspondence analysis.
MCA Multiple correspondence analysis.
FAMD Factor analysis of mixed data.
MFA Multiple factor analysis.
HCPC Hierarchical clustering on principal components.
dimdesc Dimension description.

Fonctions principales dans factoextra

Les fonctions de factoextra, décrites dans ce livre, sont listées dans le tableau ci-dessous. Voir la documentation en ligne (http://www.sthda.com/english/rpkgs/factoextra) pour une liste complète.

  • Visualisation des résultats
Fonctions Description
fviz_eig (or fviz_eigenvalue) Visualize eigenvalues.
fviz_pca Graph of PCA results.
fviz_ca Graph of CA results.
fviz_mca Graph of MCA results.
fviz_mfa Graph of MFA results.
fviz_famd Graph of FAMD results.
fviz_hmfa Graph of HMFA results.
fviz_ellipses Plot ellipses around groups.
fviz_cos2 Visualize element cos2.1
fviz_contrib Visualize element contributions.2
  • Extraction des résultats (coordonnées, cosinus carré, contributions) pour les individus/variables actifs
Fonctions Description
get_eigenvalue Access to the dimension eigenvalues.
get_pca Access to PCA outputs.
get_ca Access to CA outputs.
get_mca Access to MCA outputs.
get_mfa Access to MFA outputs.
get_famd Access to MFA outputs.
get_hmfa Access to HMFA outputs.
facto_summarize Summarize the analysis.
  • Clustering et visualisation
Fonctions Description
fviz_dend Enhanced Visualization of Dendrogram.
fviz_cluster Visualize Clustering Results.

References

Husson, Francois, Julie Josse, Sebastien Le, and Jeremy Mazet. 2017. FactoMineR: Multivariate Exploratory Data Analysis and Data Mining. https://CRAN.R-project.org/package=FactoMineR.

Kassambara, Alboukadel, and Fabian Mundt. 2017. Factoextra: Extract and Visualize the Results of Multivariate Data Analyses. http://www.sthda.com/english/rpkgs/factoextra.


  1. Cos2: quality of representation of the row/column variables on the principal component maps.

  2. This is the contribution of row/column elements to the definition of the principal components.