dimanche 9 mars 2008

Statistiques descriptives

Réaliser des statistiques descriptives reste une opération incontournable du data mining. Résumer simplement les caractéristiques des données permet d'effectuer un diagnostic rapide des principales scories (valeur unique dans une colonne, distribution très déséquilibrée, etc.) qui pourraient limiter la portée des techniques de fouille de données mises en œuvre par la suite.

Ce didacticiel montre comment mettre en œuvre les techniques de description simple des données, différentes selon que les variables sont discrètes (qualitatives) ou continues (quantitatives).

Mots clés :
statistique descriptive
Composants :
View dataset, Univariate continuous stat, Univariate discrete stat, Group characterization
Lien :
Basics.pdf
Données :
breast.txt