jeudi 20 mars 2008

Importer un fichier Weka dans Tanagra

WEKA est un logiciel de Data Mining libre très populaire dans la communauté « Machine Learning ». Il possède un format de fichier propriétaire (*.ARFF), qui est un format texte, avec des spécifications ad hoc pour documenter les variables. Importer un fichier ARFF ne pose donc pas de problèmes particuliers, dès lors que l’on sait appréhender un fichier texte.

Dans ce didacticiel, nous montrons comment charger un fichier ARFF dans TANAGRA. Lorsque le fichier comporte des données manquantes, une substitution très sommaire est mise en place : la moyenne est utilisée pour les variables continues, une nouvelle modalité est créée pour les variables discrètes.

Les traitements peuvent commencer normalement, un diagramme est automatiquement créé. Si nous décidons de le sauvegarder au format TDM, la référence du fichier est enregistrée. Au prochain chargement du diagramme, l’importation du fichier ARFF est réalisée automatiquement sans manipulations spécifiques.

Mots clés : WEKA, format de fichier ARFF, importation de données
Composants : Dataset
Lien : fr_Tanagra_Handle_WEKA_File.pdf
Données : sick.arff
Voir aussi : Importer un fichier Weka dans Sipina