samedi 5 avril 2008

Analyse de variance et comparaison de variances

L’analyse de variance (ANOVA) est, comme son nom ne l’indique pas du tout, un test statistique qui vise à comparer la moyenne d’une variable dans K sous populations. Il s’agit de la généralisation du test de comparaison de 2 moyennes. Il est paramétrique, il repose de plus sur l’hypothèse d’égalité de variance.

Dans ce didacticiel, nous montrons comment mettre en œuvre l’analyse de variance dans Tanagra. Nous montrons aussi comment procéder au test de comparaisons de variances, qui devrait être un préalable systématique à l’ANOVA. Dans la pratique, ce type de test est souvent superflu, l’ANOVA est plutôt robuste, et nous pouvons en améliorer le comportement en équilibrant les sous échantillons. Enfin, les tests de comparaisons de variance eux même sont paramétriques, et certains ne sont absolument pas robustes.

Le fichier GEAR a été récupéré sur le site (NIST/SEMATECH e-Handbook of Statistical Methods). La description sur le site n’est pas très explicite quant à la nature exacte de ces données. De notre point de vue nous considérons qu’il s’agit d’évaluer des engrenages produits par 10 machines outils différentes : nous disposons donc d’un prélèvement de 10 lots de 10 unités (100 observations). Plusieurs questions peuvent être posées : (1) est-ce que le diamètre moyen des engrenages est le même d’une machine à l’autre, (2) la variabilité du diamètre est-elle la même dans chaque lot ?

L’intérêt de ce fichier est que NIST propose ses propres résultats qui font référence au sein de notre communauté.

Mots clés : comparaison de populations, analyse de variance, test de comparaison de variances, test de bartlett, test de levene, test de brown-forsythe
Composants : One-way ANOVA, Bartlett’s test, Levene’s test, Brown-Forsythe test
Lien : fr_Tanagra_Anova_and_Tests_for_Equality_of_Variances.pdf
Données : gear_data_from_nist.xls
Référence : NIST/SEMATECH, « e-Handbook of Statistical Methods », Chapitre 7 « Product and Process Comparisons ».