mardi 23 avril 2013

Associations dans la distribution SIPINA

SIPINA est surtout connu pour ses algorithmes d’induction d’arbres de décision. En réalité, la distribution inclut deux autres outils peu connus du grand public : REGRESS, spécialisé dans la régression linéaire multiple, nous l’avions décrit dans un de nos anciens tutoriels  ; et un logiciel d’extraction de règles d’association, appelé prosaïquement « Association Rule Software » (ARS).

Depuis TANAGRA, qui intègre plusieurs composants pour l’extraction des règles d’association, ARS est très peu utilisé. J’en parle très peu moi-même. Mais comme l’outil apparaît dans le menu intégré dans Excel via la macro complémentaire « sipina.xla », plusieurs internautes m’ont demandé plus de précisions quant à son utilisation et ses spécificités.

Dans ce tutoriel, je décris la mise en œuvre du logiciel ARS lorsqu’on le lance à partir d’Excel.  Comme nous le verrons par la suite, l’interaction avec le tableur introduit des opportunités très précieuses en matière d’exploration des résultats. C’est un aspect très important tant la profusion des règles peut rapidement déconcerter. Pourvoir les filtrer et les trier de différentes manières est un atout fort dans la détection des règles les plus « intéressantes » au regard des objectifs de l’utilisateur. Les outils d’Excel nous seront d’un très grand secours à cet égard.

Mots clés : règles d'association, tableur, excel, mesures d'intérêt des règles
Composants : ASSOCIATION RULE SOFTWARE
Lien : fr_Tanagra_Association_Sipina.pdf
Données : market_basket.zip
Références :
R. Rakotomalala, « Règles d’association »
Tanagra, "Règles d'association - Comparaison de logiciels"