mercredi 2 avril 2008

Réseaux de neurones avec SIPINA, TANAGRA et WEKA

Les réseaux de neurones sont des techniques d’apprentissage directement inspirés de l’observation du fonctionnement du cerveau humain. Au final, il s’agit de modélisation. On essaie de calculer les paramètres d’un modèle à partir d’un ensemble de données.

Dans le cas de l’apprentissage supervisé, le perceptron multi-couches est certainement la technique la plus répandue. Il est très performant, pour peu qu’il soit bien paramétré. En revanche, il présente l’inconvénient d’être un modèle « boîte noire » c.-à-d. on ne perçoit pas, en tous les cas pas directement, le rôle des descripteurs dans la prédiction.

Dans ce didacticiel, nous montrons la mise en œuvre d’un perceptron dans 3 logiciels. Une fraction des données est réservée au calcul des coefficients, les poids synaptiques, une autre est utilisée pour en évaluer les performances. TANAGRA et WEKA fonctionnent de la même manière, l’apprentissage est lancé, l’utilisateur attend la fin des calculs. Le paramétrage est primordial dans ce cas, il faut définir une règle d’arrêt raisonnable.

Le déroulement de l’apprentissage, l’évolution de l’erreur de prédiction, est visible dans SIPINA. L’utilisateur a la possibilité d’interrompre les calculs. Lorsque par exemple il se rend compte que la courbe de l’erreur stagne sur un palier, et qu’il n’est plus nécessaire de poursuivre les itérations. C’est un plus considérable.

Nous utilisons le fichier IONOSPHERE.ARFF (source UCI IRVINE – format de données WEKA). Les données ont été d’emblée centrées et réduites pour nous affranchir des différences entre les techniques de pré-traitement mis en oeuvre par les logiciels. Le fichier comporte 351 observations, 33 descripteurs continus ; l’attribut classe est binaire.

Dans TANAGRA, nous en profitons pour comparer les performances du perceptron avec d’autres techniques (analyse discriminante linéaire, svm et régression logistique).

Mots clés : apprentissage supervisé, réseaux de neurones, perceptron multi couches, subdivision apprentissage test
Composants : Sampling, Supervised learning, Log-Reg TRIRLS, Linear Discriminant Analysis, C-SVC, Test
Lien : fr_Tanagra_TSW_MLP.pdf
Données : ionosphere.arff
Références :
R. Rakotomalala, « Réseaux de neurones artificiels – Perceptron simple et multi-couches ».
F. Denis, R. Gilleron, « Apprentissage à partir d’exemples – Notes de cours », chapitre 3, « Les réseaux de neurones »
Wikipédia, « Réseaux de neurones »