mercredi 2 avril 2008

Régression PLS

La régression PLS peut être vue comme une alternative à la régression linéaire multiple. A la différence qu’elle est mieux régularisée, de ce fait elle sait gérer le problème de la colinéarité.

La régression PLS peut être vue également comme une technique factorielle alternative à l’analyse canonique (qui elle même est une généralisation de l’analyse en composantes principales). A la différence qu’elle est asymétrique, on essaie bien d’expliquer les valeurs prises par un groupe de variables expliquées Y, à partir des valeurs d’un groupe de variables explicatives X.

La régression PLS est une technique performante. On peut exécuter sur de grands ensembles de données, particulièrement lorsque le nombre de variables est très élevé.

On pourrait énumérer ses qualités pendant longtemps encore. Entre autres, elle propose un dispositif efficace pour traiter les données manquantes. Cette fonctionnalité n’est cependant pas intégrée dans Tanagra (qui ne gère pas du tout les données manquantes, ça doit être fait en amont).

Ce didacticiel décrit, très succinctement, la mise en œuvre du composant PLS Regression. L’accent est mis sur les différents tableaux de résultats produits par le logiciel. L’ouvrage de Tenenhaus (1998) nous a servi de référence.

Mots clés : régression pls, analyse factorielle, régression linéaire multiple
Composants : PLS Regression
Lien : fr_Tanagra_PLS.pdf
Données : orange.bdm
Références :
M. Tenenhaus, « La régression PLS – Théorie et pratique », Technip, 1998.
S. Vancolen, « La régression PLS », Université de Neuchâtel.
H. Abdi, "Partial Least Square Regression".