mardi 30 octobre 2012

Data Mining avec Orange

Exceptionnellement, je présente dans ce post un tutoriel que je n’ai pas écrit, découvert au fil de mes recherches sur le net. Il décrit en détail, et surtout de manière particulièrement claire, les fonctionnalités du logiciel Orange.

Je trouve ce document très intéressant parce qu’il nous permet de cerner ce que nous pouvons attendre d’un logiciel de Data Mining. Il s’articule autour d’une démarche classique d’analyse de données : importation, vérification et préparation des données, visualisation graphique, modélisation, évaluation.

Par rapport aux autres logiciel libres (ou accessibles gratuitement), Orange est très « user-friendly ». Il se démarque par ses outils graphiques, intuitifs et interactifs.

Mots clés : logiciel orange, arbres de décision, induction de règles, classifieur bayesien naïf, cah, classification ascendante hiérarchique, k-means, nuées dynamiques, courbe roc, matrice de coûts
Lien : Janez Demsar, "Data Mining".
Références :
Orange - Data Mining Fruitful & Fun -- http://orange.biolab.si/