mercredi 2 avril 2008

A PRIORI sur les bases transactionnelles

Si les règles d’association peuvent être construites à partir d’un fichier « attribut-valeur » que l’on a recodé en interne, il arrive aussi que le fichier soit binaire par nature. C'est le cas des bases transactionnelles. Dans ce contexte, le recodage n’est absolument pas nécessaire, il faut traiter le fichier tel quel en se focalisant sur la présence des items dans les transactions.

TANAGRA ne gère que les fichiers tabulaires, pour spécifier la présence ou absence d’un item par chaque transaction, on utilisera la valeur 0 (absence) et 1 (présence). Lors de l’importation, ces données étant numériques, il les importe comme une variable continue.

TANAGRA peut donc construire des règles d’association sur des variables continues, sachant qu’il interprète la valeur 0 comme une absence d’un item dans la transaction, et toute autre valeur (on s’attend à ce que ce soit 1 si le fichier est correctement construit) comme une présence.

Mots clés : règles d’association, algorithme a priori
Composants : A priori
Lien : Binary_A_Priori.pdf
Données : transactions.bdm
Références :
Voir « Les règles d’association – Algorithme A priori »