dimanche 9 mars 2008

AFCM - Races canines

Analyse factorielle des correspondances multiples (AFCM ou plus simplement ACM) est une technique factorielle, descriptive, qui vise à projeter un tableau de données individus - variables, variables exclusivement catégorielles, dans un espace réduit, respectant au mieux les proximités entre les individus.

Il s'agit donc du pendant de l'analyse en composantes principales pour les variables catégorielles. Mais, contrairement à l'ACP, l'interprétation des axes factoriels à l'aide des pourcentages d'inerties, nettement plus répartis sur les axes successifs, est peu intéressante. On se concentrera avant tout sur les contributions pour leur interprétation, et les cosinus carrés pour évaluer la représentation des modalités sur les axes.

L'AFCM peut être aussi vue comme une technique de transformation de variables. Elle permet de passer d'un espace discret, décrit par les variables originales, en un espace continu, décrit par les axes factoriels. Sans perte d'informations si l'on choisit de conserver tous les axes. Avec une perte d'information contrôlée lorsque l'on ne conserve que les premiers axes. En effet, les derniers facteurs traduisent essentiellement les fluctuations aléatoires dues à l'échantillonnage, on lisse ainsi les données en nous concentrant sur les informations essentielles.

Ce didacticiel retrace un exemple tiré de l'ouvrage de M. Tenenhaus (1996) qui traite de la description de races canines à partir de caractéristiques physiques et psychiques. L'intérêt est de pouvoir comparer les résultats qu'il décrit avec les sorties que propose TANAGRA.

Mots clés : analyse factorielle des correspondances multiples, plan factoriel, contributions, cosinus carrés
Composants : Multiple correspondance analysis, View Dataset, Scatterplot with labels, View multiple scatterplot
Lien : fr_Tanagra_Acm.pdf
Données : races_canines_acm.xls
Référence : M. Tenenhaus, " Méthodes statistiques en gestion ", Dunod, 1996 ; pages 212 à 222.

anti_bug_fck