jeudi 20 mars 2008

Copier coller dans le diagramme

A mesure que les calculs deviennent complexes, la taille d’un diagramme enfle rapidement, d’autant plus que certaines séquences d’opérations sont répétitives. Il est important dans ce contexte de disposer d’outils simples pour dupliquer des branches entières du diagramme, un copier coller de composants en quelque sorte.

Dans ce didacticiel, nous voulons comparer 5 méthodes d’apprentissage en validation croisée sur un fichier de données. La construction et le paramétrage de la première branche du diagramme sont réalisés manuellement. Par la suite, pour chaque méthode, les séquences d’opérations sont les mêmes. Pouvoir dupliquer la chaîne de composants simplement est un avantage appréciable.

Dans une deuxième étape, nous avons voulu introduire une construction de variables adéquate pour bonifier l’apprentissage. Nous effectuons une analyse en composantes principales sur les descripteurs. L’apprentissage supervisé est ensuite réalisé sur les axes factoriels les plus significatifs. L’idée est de « lisser » les données de manière à ne conserver que l’information utile pour la modélisation. Dans le contexte de ce fichier, avec un rapport nombre de variables – nombre d’individus élevés, cette préparation est vraisemblablement avantageuse. Nous voulons justement le vérifier en répétant les comparaisons ci-dessus. Dans ce cas, c’est toute une branche du diagramme qu’il faut dupliquer, il est évident que le copier coller est indispensable, ré-insérer manuellement la série de composants est non seulement fastidieuse mais expose le praticien à de multiples erreurs de manipulations.

Mots clés : copier coller, comparaison de classifieurs, apprentissage supervisé, validation croisée, régression logistique, régression pls, svm, analyse discriminante linéaire, k-nn, analyse en composantes principales, régularisation
Composants : Supervised learning, Binary logistic regression, C-PLS, C-SVC, Linear discriminant analysis, K-NN, Principal Component Analysis
Lien : fr_Tanagra_Diagram_New_Features.pdf
Données : sonar.xls
Voir aussi : Comparaison de classifieurs