L’Analyse Factorielle Multiple est dédiée aux tableaux de données où les variables sont structurées en groupes. Plusieurs jeux de variables (continues ou qualitatives) sont ainsi étudiées simultanément

Les données

On dispose d’un échantillon de 21 vins rouges de la Vallée de Loire provenant de 3 régions différentes.

On veut caractériser les vins. On cherche une typologie des vins. La méthode appropriée pour caractériser les vins par des variables continues est l’ACP. Cependant, le tableau de données est structuré en différents groupes de variables :

Nous disposons dont 31 variables.

De nouveaux objectifs apparaissent comme comparer les groupes de variables (deux groupes de variables sont proches si deux vins proches l’un de l’autre du point de vue du premier groupe de variables le sont aussi du point de vue du deuxième) et mettre en évidence une typologie des groupes ou comparer de façon simultanée les typologies des vins vus par chaque groupe de variables pris un par un.

Source : http://factominer.free.fr/advanced-methods/analyse-factorielle-multiple.html

data(wine)
colnames(wine)
##  [1] "Label"                         "Soil"                         
##  [3] "Odor.Intensity.before.shaking" "Aroma.quality.before.shaking" 
##  [5] "Fruity.before.shaking"         "Flower.before.shaking"        
##  [7] "Spice.before.shaking"          "Visual.intensity"             
##  [9] "Nuance"                        "Surface.feeling"              
## [11] "Odor.Intensity"                "Quality.of.odour"             
## [13] "Fruity"                        "Flower"                       
## [15] "Spice"                         "Plante"                       
## [17] "Phenolic"                      "Aroma.intensity"              
## [19] "Aroma.persistency"             "Aroma.quality"                
## [21] "Attack.intensity"              "Acidity"                      
## [23] "Astringency"                   "Alcohol"                      
## [25] "Balance"                       "Smooth"                       
## [27] "Bitterness"                    "Intensity"                    
## [29] "Harmony"                       "Overall.quality"              
## [31] "Typical"
glimpse(wine)
## Observations: 21
## Variables: 31
## $ Label                         <fctr> Saumur, Saumur, Bourgueuil, Chi...
## $ Soil                          <fctr> Env1, Env1, Env1, Env2, Referen...
## $ Odor.Intensity.before.shaking <dbl> 3.074, 2.964, 2.857, 2.808, 3.60...
## $ Aroma.quality.before.shaking  <dbl> 3.000, 2.821, 2.929, 2.593, 3.42...
## $ Fruity.before.shaking         <dbl> 2.714, 2.375, 2.560, 2.417, 3.15...
## $ Flower.before.shaking         <dbl> 2.280, 2.280, 1.960, 1.913, 2.15...
## $ Spice.before.shaking          <dbl> 1.960, 1.680, 2.077, 2.160, 2.04...
## $ Visual.intensity              <dbl> 4.321, 3.222, 3.536, 2.893, 4.39...
## $ Nuance                        <dbl> 4.000, 3.000, 3.393, 2.786, 4.03...
## $ Surface.feeling               <dbl> 3.269, 2.808, 3.000, 2.538, 3.38...
## $ Odor.Intensity                <dbl> 3.407, 3.370, 3.250, 3.160, 3.53...
## $ Quality.of.odour              <dbl> 3.308, 3.000, 2.929, 2.880, 3.36...
## $ Fruity                        <dbl> 2.885, 2.560, 2.769, 2.391, 3.16...
## $ Flower                        <dbl> 2.320, 2.440, 2.192, 2.083, 2.23...
## $ Spice                         <dbl> 1.840, 1.739, 2.250, 2.167, 2.14...
## $ Plante                        <dbl> 2.000, 2.000, 1.750, 2.304, 1.76...
## $ Phenolic                      <dbl> 1.650, 1.381, 1.250, 1.476, 1.60...
## $ Aroma.intensity               <dbl> 3.259, 2.962, 3.077, 2.542, 3.61...
## $ Aroma.persistency             <dbl> 2.963, 2.808, 2.800, 2.583, 3.29...
## $ Aroma.quality                 <dbl> 3.200, 2.926, 3.077, 2.478, 3.46...
## $ Attack.intensity              <dbl> 2.963, 3.036, 3.222, 2.704, 3.46...
## $ Acidity                       <dbl> 2.107, 2.107, 2.179, 3.179, 2.57...
## $ Astringency                   <dbl> 2.429, 2.179, 2.250, 2.185, 2.53...
## $ Alcohol                       <dbl> 2.500, 2.654, 2.643, 2.500, 2.78...
## $ Balance                       <dbl> 3.250, 2.926, 3.321, 2.333, 3.46...
## $ Smooth                        <dbl> 2.731, 2.500, 2.679, 1.680, 3.03...
## $ Bitterness                    <dbl> 1.926, 1.926, 2.000, 1.963, 2.07...
## $ Intensity                     <dbl> 2.857, 2.893, 3.074, 2.462, 3.64...
## $ Harmony                       <dbl> 3.143, 2.964, 3.143, 2.038, 3.64...
## $ Overall.quality               <dbl> 3.393, 3.214, 3.536, 2.464, 3.74...
## $ Typical                       <dbl> 3.250, 3.036, 3.179, 2.250, 3.44...

L’objectif est :

Nous allons étudier les profils de vins selon l’évaluation sensorielle. On utilisera comme groupes actifs les groupes odor, visual, odor after shaking et taste et comme groupes illustratifs les groupes origin et overall.

res.mfa = MFA(wine, group=c(2,5,3,10,9,2), type=c("n",rep("s",5)), ncp=5, name.group=c("origin","odor","visual","odor.after.shaking", "taste","overall"), num.group.sup=c(1,6))

Ces premiers résultats s’interprètent de la même façon que ceux d’une ACP.

La représentation des variables montre que la plupart des variables sont fortement corrélées à la première dimensions, quel que soit le groupe auquel elles appartiennent. Cette dimension représente “intensité” et “harmonie”, des notions positives communément utilisées en parlant de vins. Les variables les plus corrélées à la deuxième dimension sont Spice before shaking et Odor intensity before shaking du groupe odor, Spice, Plant et Odor intensity du groupe odor after shaking et Bitterness du groupe taste. Cette dimension représente une caractéristique épicée, végétale, essentiellement due à l’olfaction.

Les coordonnées des individus et modalités peuvent être liées à cette interprétation des deux premières composantes principales via l’observation du deuxième graphique. Le vin 1DAM a été évalué comme le plus “intense” et “harmonieux” contrairement aux vins 1VAU et 2ING qui sont les moins “intenses”et “harmonieux”. Le deuxième axe est essentiellement dû aux vins T1 et T2. Ces deux vins étant en fait le même évalué deux fois par les juges, la deuxième dimension sera désignée comme le “cas particulier du vin T”. La plupart des modalités sont proches de l’origine du plan factoriel, ce qui signifie que ces modalités ne sont pas reliées à l’“intensité”, l’“harmonie” ou au “vin T”. La modalité Env4 possède des coordonnées élevées sur le deuxième axe mais uniquement en lien avec T1 et T2. La modalité Reference, a priori en relation avec un sol réputé pour la qualité des vins qu’il produit, possède des coordonnées élevées sur le premier axe et est donc positivement corrélée aux notions “intensit” et “harmonie”, ce qui confirme l’a priori.

Le graphique des individus partiels représente chaque vin vu par chaque groupe et son barycentre. Par défaut, les deux vins avec le plus petite inertie intra-groupe et les deux vins avec la plus grande intertie intra-groupe sont représentés. Pour représenter tous les points partiels, utilisez la ligne de code suivante :

plot(res.mfa,choix="ind",partial="all")

1DAM a été évalué comme particulièrement “intense” et “harmonieux”, notamment par le groupe odor : ses coordonnées sur le premier axe sont plus extrêmes du point de vue de ce groupe que de celui des autres. Du point de vue du groupe odor, 2ING était plus “intense” et “harmonieux” que 1VAU mais du point de vue du groupe taste, 1VAU était plus “intense” et “harmonieux” que 2ING.

Tous les groupes ont à peu près la même vision des modalités sauf pour la modalité Env4, ce qui reprend l’interprétation de la représentation des individus.

Ce graphique montre la qualité de représentation de chaque groupe. Les quatre groupes actifs ont des coordonnées rapprochées sur la première dimension ce qui signifie que leur contribution à la première composante principale est à peu près la même. Cela signifie également que la première composante principale de l’AFM est commune à tous les groupes. Quant à la deuxième dimension, ce sont les groupes d’olfaction qui y ont les coordonnées les plus élevées. Ces deux groupes contribuent le plus à la deuxième composante principale.

Ce graphe est fourni pour l’étude du lien entre les composantes principales de l’AFM et celles de chacun des groupes. A l’exception du groupe origin, la première dimension de chaque groupe est hautement corrélée à celle de l’AFM. La deuxième dimension de l’AFM est essentiellement corrélée à la deuxième dimension des groupes d’olfaction.