dimanche 9 mars 2008

ACP - Description de véhicules

L'analyse en composantes principales est une technique factorielle très populaire. On peut la voir de différentes manières.

Elle permet de visualiser un ensemble de données comportant plusieurs variables dans un espace de dimension réduite, dans le plan le plus souvent, en respectant plus ou moins les proximités entre les individus. Profitant d'une meilleure visualisation, le praticien du data mining peut détecter les groupes d'observations correspondant à des caractéristiques similaires.

L'ACP permet aussi de résumer les informations que porte les variables en les décomposant en des dimensions orthogonales, les composantes principales.

L'ACP constitue également une technique de régularisation, en proposant des variables synthétiques qui portent les informations " utiles " pour les techniques de fouilles de données qui viennent en aval.

La liste est longue...

Ce didacticiel montre la mise en œuvre de l'ACP dans un cadre descriptif. Il reprend un exemple décrit dans l'ouvrage de G.Saporta (Dunod, 2006). L'intérêt est de pouvoir faire le parallèle entre les sorties décrites dans l'ouvrage et les outils que propose TANAGRA pour évaluer et interpréter les résultats.

L'exemple traité concerne la description d'un ensemble de véhicules à l'aide de leurs caractéristiques (cylindrée, puissance, poids, etc.).

(Note de mise à jour : d'autres outils sont disponibles - "ACP avec Tanagra - Nouveaux outils" [15/06/2012])

Mots clés : analyse en composantes principales, analyse factorielle, méthodes de description, plan factoriel, cercle des corrélations
Composants : Principal Component Analysis, View Dataset, Scatterplot with labels, Correlation scatterplot, View multiple scatterplot
Lien : fr_Tanagra_Acp.pdf
Données : autos_acp.xls
Référence : G. Saporta, " Probabilités, Analyse de données et Statistique ", Dunod, 2006 ; pages 177 à 181.

anti_bug_fck