samedi 8 mars 2008

Connexion Excel - Sipina

L'importation des données est un écueil important pour les logiciels libres de Data Mining. La grande majorité des utilisateurs travaillent avec un tableur, Excel principalement, en la couplant avec un logiciel spécialisé de Data Mining (voir à ce sujet l'enquête KDD). Dès lors, une question récurrente des utilisateurs est "comment faire pour importer mes données dans Sipina ?"
Il est possible d'importer différents types de formats avec Sipina. Pour ce qui est des classeurs Excel, un dispositif particulier a été mis en place.
Une macro complémentaire est copiée automatiquement sur la machine lors de l'installation de la version recherche de SIPINA. Il faut l'intégrer dans Excel. La macro ajoute un nouveau menu dans le tableur. Après avoir sélectionné la plage de données, l'utilisateur n'a plus qu'à l'activer, s'en suivent les opérations suivantes : (1) SIPINA est automatiquement démarré ; (2) les données sont transférées via le presse-papier ; (3) SIPINA considère que la première ligne de la plage de cellules correspond aux noms de variables ; (4) les colonnes avec des valeurs numériques sont des variables quantitatives ; (5) les colonnes avec des valeurs alphanumériques sont des variables catégorielles.
Contrairement aux autres didacticiels, la séquence des manipulations sont décrites dans une vidéo. Cela relativise un peu le fait que le descriptif qui l'accompagne soit en anglais.
Note (07/08/2014) : les didactciels montrent la procédure pour les anciennes versions d'Office (jusqu'à Office 2003). Pour les versions plus récentes (Excel 2007 et Excel 2010), un nouveau descriptif à été mis en ligne.
Mots clés : arbres de décision, importation des données, fichier excel
Installation : sipina_xla_installation.htm
Utilisation : sipina_xla_processing.htm