mercredi 2 avril 2008

Règles d’association « supervisées »

Dans de très nombreuses analyses, il est souvent nécessaire de caractériser un groupe d’individus. Dans le cadre de la classification automatique par exemple, après avoir la constitution des classes, nous devons les interpréter. Il s’agit d’identifier les caractéristiques communes aux observations situées dans le même groupe. Et c’est là que les difficultés commencent…

Le composant GROUP CHARACTERIZATION joue ce rôle en calculant des statistiques descriptives comparatives entre le groupe qui nous intéresse et les autres groupes ou la totalité de l’échantillon. Bien que très instructif, cet outil est limité par le fait qu’il effectue essentiellement des comparaisons univariées, variable par variable, il ne permet pas de tenir compte des interactions entre les variables.

La seconde piste la plus souvent évoquée dans la littérature est l’analyse factorielle. Elle permet de « visualiser » les groupes dans les plans factoriels. La démarche est bien multivariée. En revanche, on se heurte à un second écueil, il faut maintenant interpréter les facteurs.

Dans ce didacticiel, nous montrons l’utilisation du composant SPV ASSOC TREE. Il permet de réaliser des caractérisations multivariées, mettant en oeuvre la conjonction de plusieurs variables. La méthode, très simple, s’appuie essentiellement sur le mécanisme des règles d’association dans lequel nous fixons la modalité que nous voulons voir dans le conséquent des règles.

Dans notre exemple, les classes sont définies a priori, elles sont désignées par une variable supplémentaire dans notre base. Elles auraient pu également, comme nous le signalons plus haut, être le produit d’un clustering en amont.

Mots clés : règles d’association, caractérisation des groupes, clustering, classification automatique
Composants : Group Characterization, Spv Assoc Tree
Lien : fr_Tanagra_Spv_Assoc_Tree.pdf
Données : vote.txt
Références :
Voir « Les règles d’association – A priori »