samedi 30 août 2008

Comparaison des dispersions pour K échantillons indépendants

Les tests de comparaison de variances sont souvent présentés comme des préalables aux tests de comparaisons de moyennes, pour s’assurer de l’hypothèse d’homoscédasticité. Mais ce n’est pas leur seule finalité. Comparer les dispersions peut être une fin en soi.

Les tests paramétriques reposent principalement sur la normalité des données. Nous mettons en avant le test de Levene dans ce didacticiel. D’autres tests existent, nous les signalerons dans le texte.

Lorsque l’hypothèse de normalité est battue en brèche, lorsque les effectifs sont faibles, lorsque la variable est plus ordinale que continue, on a intérêt à passer aux tests non paramétriques. On parle alors de comparaison d’échelles ou de dispersions. En effet les procédures ne reposent plus sur les variances estimées. Nous utiliserons dans ce didacticiel les techniques les plus connues tels que le test de Ansari-Bradley, le test de Mood ou le test de Klotz. Ils ont un champ d’application plus large puisque non paramétriques. Ils présentent en revanche un inconvénient fort, ils sont inapplicables dès que les caractéristiques de tendance centrale conditionnelles (on dira la médiane pour simplifier) sont différentes.

Nous montrons la mise en œuvre de ces différents tests dans TANAGRA. Nous inspecterons et confronterons les résultats. Nous essayerons d’apporter des solutions lorsque les conditions d’utilisation des tests ne sont pas respectées.

Les données décrivent les performances de dispositifs de chauffage écologique. La variable d’intérêt est la température à l’intérieur d’une cabane au petit matin de l’automne, au fin fond de la forêt, lorsque le loup n’est pas rentré dans sa tanière encore. Nous disposons de n = 45 observations. Un premier groupe de n1 = 15 cabanes sert de témoin. Aucun système n’a été mis en place. Deux autres groupes (n2 = 15 et n3 = 15) sont constitués : l’un bénéficie d’un système basé sur un réchauffement naturel de l’air, l’autre s’appuie sur le réchauffement de l’eau. On cherche à comparer la disparité des températures d’un groupe à l’autre.

Les aspects théoriques relatifs à ce didacticiel sont décrits dans des supports de cours accessibles en ligne (voir références). D'autres tutoriels sont consacrés à la comparaison de variances (voir Comparaison de populations - Tests paramétriques univariés ; Analyse de variance et comparaison de variances ; etc.)

Mots clés : tests paramétriques, tests non paramétriques, échantillons indépendants, test de comparaison de variances, test de comparaison de dispersions ou d’échelles, test de Levene, test de Bartlett, test de Brown-Forsythe, test de Mood, test de Klotz, test de Ansari-Bradley
Composants : LEVENE’S TEST, ANSARI-BRADLEY SCALE TEST, MOOD SCALE TEST, KLOTZ SCALE TEST
Lien : fr_Tanagra_Nonparametric_Test_for_Scale_Differences.pdf
Données : tests_for_scale_differences.xls
Références :
R. Rakotomalala, « Comparaison de populations. Tests non paramétriques », Université Lyon 2.
R. Rakotomalala, « Comparaison de populations. Tests paramétriques », Université Lyon 2.

vendredi 29 août 2008

Tests de comparaison pour 2 échantillons appariés

L’appariement est une procédure qui vise à réduire l’effet des fluctuations d’échantillonnage c.-à-d. la variabilité due aux observations. Nous pouvons l’associer à différentes configurations.

Le schéma des « mesures répétés » est le premier qui vient à l’esprit. Il s’agit de mesurer la même grandeur chez un même individu, avant et après intervention d’une action dont on veut justement évaluer les conséquences. Par exemple, on mesure la fièvre chez un malade, on lui donne un médicament, après un certain laps de temps, on lui prend de nouveau sa température : les deux mesures sont confrontées.

L’appariement peut être aussi le fruit de la constitution des données en blocs. Si l’on souhaite comparer l’efficacité de 2 méthodes d’enseignement, les mesures répétées sont inappropriées. Dans les paires d’observations, que l’on appelle « blocs », nous associerons alors des élèves identiques par rapport aux caractéristiques de l’étude. Par exemple, on met dans chaque paire des élèves qui, par le passé, ont obtenu des résultats identiques aux examens.

Enfin, l’appariement peut être tout simplement inhérent à la situation que l’on cherche à analyser. Par exemple, on cherche à comparer le temps passé devant la télévision par l’homme et la femme à l’intérieur d’un couple. Les blocs correspondent naturellement aux ménages. Les hommes et les femmes ne doivent pas être considérés comme des observations indépendantes.

Les tests de comparaisons spécifiques à ce type de configuration présentent une caractéristique particulière : l’appréciation des différences est réalisée prioritairement à l’intérieur des blocs. Dans ce didacticiel, nous présentons deux techniques non paramétriques, le test des signes et le test des rangs signés de Wilcoxon, et une technique paramétrique, le test de Student pour échantillons appariés.

Les données proviennent du site de cours en ligne du Pr Richard Lowry du « Vassar College ». Nous traitons l’exemple utilisé pour illustrer le test des rangs signes de Wilcoxon. On a posé deux questions, QA et QB, à des étudiants, du type « quelle est la probabilité que… ». On cherche à savoir si les valeurs de QA sont stochastiquement différentes de celles de QB. Le principe, les formules et les calculs spécifiques à ces données sont détaillés sur le site web. Nous pouvons suivre à la trace les résultats fournis par TANAGRA.

Les aspects théoriques relatifs à ce didacticiel sont décrits dans des supports de cours accessibles en ligne (voir références). D'autres tutoriels abordent également le sujet de la comparaison sur échantillons apapriés (voir Tests paramétriques univariés, Tests non paramétriques, etc.)

Mots clés : tests non paramétriques, échantillons appariés, test des signes, test des rangs signés de Wilcoxon, test de Student pour échantillons appariés, test de normalité
Composants : SIGN TEST, WILCOXON SIGNED RANK TEST, PAIRED T-TEST, FORMULA, NORMALITY TEST
Lien : fr_Tanagra_Nonparametric_Test_for_Two_Related_Samples.pdf
Données : comparison_2_related_samples.xls
Références :
R. Rakotomalala, « Comparaison de populations. Tests non paramétriques », Université Lyon 2.
R. Rakotomalala, « Comparaison de populations. Tests paramétriques », Université Lyon 2.
R. Lowry, « Concepts and Applications of Inferential Statistics », SubChapter 12a. The Wilcoxon Signed-Rank Test.

jeudi 28 août 2008

Test de Kruskal-Wallis et comparaisons multiples

Les tests de comparaison de populations visent à déterminer si (K >= 2) échantillons proviennent de la même population au regard d’une variable d’intérêt (X). En d’autres termes, nous souhaitons vérifier que la distribution de la variable est la même dans chaque groupe. On utilise également l’appellation « tests d’homogénéité » dans la littérature.

Les tests non paramétriques lorsque l’on ne fait pas d’hypothèse sur la distribution de X, on parle aussi de tests « distribution free ».

Dans ce didacticiel, nous nous intéressons plus particulièrement à la configuration où la variable d’intérêt prend stochastiquement des valeurs plus élevées (ou plus faibles, ou simplement différentes) dans une des sous populations. On suppose que la différenciation se fait sur un décalage entre les caractéristiques de tendance centrale des distributions conditionnelles. On parle de modèle de localisation. Le test de Kruskal-Wallis est certainement celui qui vient immédiatement à l’esprit pour traiter ce type de problèmes. Nous verrons dans ce didacticiel que d’autres tests existent. Nous comparerons les résultats obtenus. Nous complèterons l’étude en procédant à des comparaisons multiples, on souhaite détecter les groupes qui diffèrent significativement les uns des autres.

Les données proviennent du site de cours en ligne du Pr Richard Lowry du « Vassar College ». Nous traitons l’exemple utilisé pour illustrer le test de Kruskal-Wallis. On a demandé à n = 21 personnes d’évaluer 3 types de vins (A, B et C) : n1 = 8 ont noté le premier type de vin 1, n2 = 7 pour le second et, n3 = 6 pour le troisième. On souhaite savoir si les notes attribuées sont significativement différentes d’un groupe à l’autre.

Il y a une grosse feinte dans l’expérimentation. En réalité, le vin est exactement le même quel que soit le groupe. C’est l’entretien d’évaluation, débouchant sur l’attribution de la note, qui a été mené de différentes manières. Il est enthousiaste pour le groupe A, un peu moins dans le groupe B, il est neutre dans le groupe C.

La variable d’intérêt est RATING. Elle va de 1 à 10, meilleure sera l’appréciation, plus élevée sera la note. Un complément intéressant de ce tutoriel serait d’étudier le comportement des méthodes paramétriques (ANOVA à 1 Facteur et WELCH ANOVA) sur ces mêmes données.

Les aspects théoriques relatifs à ce didacticiel sont décrits dans un support de cours accessible en ligne (voir références).

Mots clés : tests non paramétriques, test de Kruskal-Wallis, test de Van der Waerden, test de Fisher-Yates-Terry-Hoeffding, test des médianes, modèle de localisation
Composants : KRUSKAL-WALLIS 1-WAY ANOVA, MEDIAN TEST, VAN DER WAERDEN 1-WAY ANOVA, FYTH 1-WAY ANOVA
Lien : fr_Tanagra_Nonparametric_Test_KW_and_related.pdf
Données : wine_evaluation_nonparametric.xls
Références :
R. Rakotomalala, « Comparaison de populations. Tests non paramétriques », Université Lyon 2.
R. Lowry, « Concepts and Applications of Inferential Statistics », SubChapter 14a. The Kruskal-Wallis Test for 3 or More Independent Samples.

mercredi 27 août 2008

Tests non paramétriques de comparaison de 2 populations. Modèle de localisation.

Les tests de comparaison de populations visent à déterminer si (K >= 2) échantillons proviennent de la même population au regard d’une variable d’intérêt (X). En d’autres termes, nous souhaitons vérifier que la distribution de la variable est la même dans chaque groupe. On utilise également l’appellation « tests d’homogénéité » dans la littérature.

Les tests non paramétriques lorsque l’on ne fait pas d’hypothèse sur la distribution de X, on parle aussi de tests « distribution free ».

De manière générique, le test de Kolmogorov-Smirnov consiste à comparer les fonctions de répartition empiriques (CDF : cumulative distribution function, en anglais). Dans ce cas, on cherche toute forme de différenciation entre les distributions.

On peut approfondir l’analyse en qualifiant la forme de la différenciation. Une approche très usitée consiste à déterminer si les valeurs de la variable d’intérêt sont stochastiquement plus élevés (plus faibles, ou tout simplement différents) dans un des sous échantillons. Le test de Wilcoxon-Mann-Whitney est certainement la technique la plus populaire, nous verrons dans ce didacticiel que d’autres tests non paramétriques peuvent être utilisés.

Les données proviennent du site de cours en ligne de l’Université Penn State de Pennsylvanie « STAT 500 – Applied Statistics ». Nous nous intéressons à la leçon n°10 qui traite de la comparaison de moyennes. Il s’agit d’évaluer les performances de 2 machines, une ancienne et une nouvelle, lors de l’empaquetage de cartons. La variable d’intérêt est la durée de l’opération.

Les données semblent compatibles avec une distribution normale, les tests paramétriques sont à privilégier dans ce cas. Le site d’ailleurs détaille les résultats du test de Student de comparaison de moyenne. La statistique du test est t = -3.40, l’écart est très significatif avec une probabilité critique (p-value) p = 0.0032 pour un test bilatéral.

Un aspect intéressant de ce tutoriel sera d’étudier le comportement les tests non paramétriques sur ces données, et de confronter les résultats avec celui du test de Student.

Les aspects théoriques relatifs à ce didacticiel sont décrits dans un support de cours accessible en ligne (voir références).

Mots clés : tests non paramétriques, test de Kolmogorov-Smirnov, test de Wilcoxon-Mann-Whitney, test de Van der Waerden, test de Fisher-Yates-Terry-Hoeffding, test de la médiane, modèle de localisation
Composants : FYTH 1-WAY ANOVA, K-S 2-SAMPLE TEST, MANN-WHITNEY COMPARISON, MEDIAN TEST, VAN DER WAERDEN 1-WAY ANOVA
Lien : fr_Tanagra_Nonparametric_Test_MW_and_related.pdf
Données : machine_packs_cartons.xls
Références :
R. Rakotomalala, « Comparaison de populations. Tests non paramétriques », Université Lyon 2.
Wikipedia, « Non-parametric statistics ».

samedi 23 août 2008

Comparaison de populations – Tests non paramétriques

Les tests de comparaison de populations visent à déterminer si K (K >= 2) échantillons proviennent de la même population au regard d’une variable d’intérêt (X). En d’autres termes, nous souhaitons vérifier que la distribution de la variable est la même dans chaque groupe. On utilise également l’appellation « tests d’homogénéité » dans la littérature.

Les tests non paramétriques présentent la particularité de ne pas faire d’hypothèses sur la distribution de X. On parle de tests « distribution free ». Leur champ d’application est donc théoriquement plus étendu que celui de leurs homologues paramétriques.

Ce document n’est pas à proprement parler un tutoriel. Il s’agit plutôt d’un fascicule de cours. Nous l’intégrons à ce site néanmoins car il intègre un grand nombre de sorties de Tanagra décortiquées en détail et mises en relation directe avec les formules sous-jacentes. Les productions de Tanagra sont également comparées avec celles des autres logiciels, libres (R) ou commerciaux (SAS).

Plusieurs didacticiels sur ce site traitent les thèmes abordés dans ce document (par ex. Analyse de variance de Friedman, Tests non paramétriques, etc.). Il serait intéressant de comparer les résultats produits par ces tests avec ceux des tests paramétriques équivalents.

Mots clés : tests non paramétriques, test de Kolmogorov-Smirnov, test de Kuiper, test de Cramer-von Mises, test de Wilcoxon-Mann-Whitney, test de Van der Waerden, test de Fisher-Yates-Terry-Hoeffding, test de la médiane, test de Kruskal-Wallis, modèle de localisation, test de Mood, test de Klotz, test de Ansari-Bradley, modèle d’échelle, test des signes, test de rangs signés de Wilcoxon, anova de Friedman, test Q de Cochran
Composants : ANSARI-BRADLEY SCALE TEST, CONCHRAN’S Q-TEST, FRIEDMAN’S ANOVA BY RANKS, FYTH 1-WAY ANOVA, KLOTZ SCALE TEST, KRUSKAL-WALLIS 1-WAY ANOVA, K-S 2-SAMPLE TEST, MANN-WHITNEY COMPARISON, MEDIAN TEST, MOOD SCALE TEST, SIGN TEST, VAN DER WAERDEN 1-WAY ANOVA, WILCOXON SIGNED RANKS TEST
Lien : Comparaison de populations - Tests non paramétriques
Données : dataset_support_tests_non_parametriques.xls
Références :
R. Rakotomalala, « Comparaison de populations. Tests non paramétriques », Université Lyon 2.
Wikipedia, « Non-parametric statistics ».