Articles - Méthodes des Composantes Principales dans R: Guide Pratique

AFDM dans R avec FactoMineR: Scripts Faciles et Cours

L’Analyse Factorielle des Données Mixtes (AFDM ou FAMD pour factor analysis of mixed data en anglais) est dédiée à l’analyse des données contenant à la fois des variables catégorielles et des variables quantitatives.

Cet article vous montre comment calculer et interpréter l’AFDM en utilisant le logiciel R et le package FactoMineR.

De manière globale, l’AFDM peut être considérée comme un mixte entre l’analyse en composantes principales (ACP) et l’analyse des correspondances multiples (ACM). Il agit comme l’ACP pour les variables quantitatives et comme l’ACM pour les variables qualitatives.

l’AFDM permet d’étudier les similitudes entre les individus en prenant en compte des variables mixtes et d’étudier les relations entre toutes les variables (variables qualitatives et quantitatives).

Il crée également le graphique des individus, le cercle de corrélation pour les variables continues et le graphique des catégories pour les variables catégorielles. De plus, il produit des graphiques spécifiques pour visualiser la relation entre les variables quantitatives et qualitatives.

Contents:

Code R: guide de demarrage rapide

  1. Installer FactoMineR:
install.packages("FactoMineR")
  1. Calculer l’AFDM en utilisant le jeu de données wine [dans FactoMineR]. Ce jeu données fait référence à 21 caractéristiques du vin. Nous allons calculer l’AFDM avec un petit échantillon des données. Les variables catégorielles et continues sont détectées automatiquement.
library(FactoMineR)
data("wine")
df <- wine[, c(1, 2, 16, 22, 29, 28, 30,31)]
res.famd <- FAMD(df, graph = FALSE)
  1. Visualiser les valeurs propres. Montre le pourcentage de variances expliquées par chaque axe principal.
eig.val <- res.famd$eig
barplot(eig.val[, 2], 
        names.arg = 1:nrow(eig.val), 
        main = "Variances Explained by Dimensions (%)",
        xlab = "Principal Dimensions",
        ylab = "Percentage of variances",
        col ="steelblue")
# Add connected line segments to the plot
lines(x = 1:nrow(eig.val), eig.val[, 2], 
      type = "b", pch = 19, col = "red")

  1. Graphique des individus. Les individus similaires sont groupés ensemble. Les catégories des variables qualitatives sont montrées en gras.
plot(res.famd, choix = "ind")

  1. Corrélation entre les variables (qualitatives et quantitatives) avec les axes principaux:
plot(res.famd, choix = "var")

  1. Cercle de corrélation des variables quantitatives:
plot(res.famd, choix = "quanti")

Vidéos