Exemple de test d’ANOVA
Exemple Excel pour cette ANOVA
Voir une vidéo COMMENT FAIRE de cet exemple
Une étude de recherche a comparé les onces de café consommées quotidiennement entre trois groupes. Le Groupe 1 était composé des Italiens, du Groupe 2 Français et du Groupe 3 américain. Déterminez s’il existe une différence significative entre les groupes en utilisant un niveau de 5% (alpha est.05).
Groupe 1: Italien
Groupe 2: Français
Groupe 3: Américain
Les résultats de cette étude sont dans le tableau suivant:
Groupe 1 | Groupe 2 | Groupe 3 | |
n (taille de l’échantillon) | 70 taille de l’échantillon 1 | 70 taille de l’échantillon 2 | 70 taille de l’échantillon 3 |
M | 4,0 moyenne de l’échantillon 1 | 3,7 moyenne de l’échantillon 2 | 3,4 moyenne de l’échantillon 3 |
s^2 | 4,4 variance pour le groupe 1 | 5,2 variance pour le groupe 2 | 6.1 écart pour le groupe 3 |
Notez que dans cet exemple :
« n » est la taille de l’échantillon pour chaque groupe
« M » est la « moyenne de l’échantillon » pour chaque groupe
« s^2 » est la variance de l’échantillon pour chaque groupe
N = n1 + n2 + n3 = 70+ 70+70 = 210
NOTEZ que « N » est la taille de l’échantillon combinée pour les trois groupes.
Étape 1: L’hypothèse nulle et alternative Ho et Ha
Ho (le nul) représenteront que tous les groupes sont statistiquement les mêmes.
Ho: groupe moyen 1 = groupe moyen 2 = groupe moyen 3
L’hypothèse Ha (alternative ou recherche) représentera qu’au moins un des groupes est statistiquement significativement différent.
Ha: groupe moyen 1 group groupe moyen 2 group groupe moyen 3
Étape 2: Déterminez les « degrés de liberté » également appelés df pour chaque groupe et pour la combinaison de groupes:
Le df ENTRE est calculé en soustrayant 1 du nombre de groupes que vous avez. Nous avons trois groupes ici.
df ENTRE = 3 – 1 = 2 (Utilisé comme numérateur ou df supérieur)
Ensuite, le df INTÉRIEUR est calculé en déterminant d’abord le df individuel pour chaque groupe, puis en les additionnant:
df group1 = 70 – 1 = 69
groupe df 2 = 70 – 1 = 69
groupe df 3 = 70 – 1 = 69
df DANS = 69 + 69 + 69 = 207 (Utilisé comme dénominateur ou df inférieur)
Étape 3: Utilisez la table F ou une technologie pour obtenir les valeurs de « coupure » pour cette ANOVA de test F. N’oubliez pas que tous les tests d’hypothèse ont des valeurs de coupure que vous utilisez pour déterminer si le résultat de votre test F est dans la région de rejet ou non.
REMARQUE : La table F ne peut pas contenir toutes les valeurs possibles. Ainsi, la plupart des tables F contiennent des valeurs et vous choisirez la valeur de placard de vos numéros df.
IMPORTANT: Pour cette raison, différents manuels ou exemples auront des valeurs de coupure légèrement différentes pour leurs tests F. Dans ce cas, j’utilise le tableau ci-dessous et ma valeur de coupure est de 3,07. Cependant, un exemple similaire pourrait avoir un seuil de 3.09 par exemple.
Pour obtenir une coupure plus précise, utilisez Excel pour exécuter l’ANOVA. Excel générera les valeurs p pour vous.
Exemple Excel d’ANOVA
Par conséquent, notre valeur de coupure pour le test F est de 3,07 ici.
Étape 4: Exécutez le test F pour déterminer les valeurs F. Comparez ensuite les résultats de la valeur de test F aux valeurs de coupure.
Exécuter un test F à la main comporte quelques étapes.
Première étape:
Calculer la grande moyenne (GM) = (4.0 + 3.7 + 3.4) / 3 = 3.7
Cette grande moyenne est la somme de toutes vos moyennes individuelles, divisée par le nombre total de vos groupes. Nous avons trois groupes. Nous ajoutons donc les trois moyens de groupe ensemble et divisons par 3.
Deuxième étape
Calculer la variance des moyennes. NOTEZ que 3,7 est la grande moyenne. Notez que 4.0, 3.7 et 3.4 sont des moyennes de groupe individuelles. Notez que « 2 » est le df ENTRE.
s^2M = ( ^2 + ^2 + ^2 ) / DF entre
= ( ^2 + ^2 + ^2 ) / 2
= ( ^2 + ^2 + ^2 ) / 2
= ( .09 + 0 + .09 ) / 2
= .18/2
= .09
Qu’avons-nous fait ici ?
Le s ^M est calculé en soustrayant la grande moyenne dans ce problème de 3,7 que nous avons calculée dans la première étape de chaque moyenne de groupe individuelle. Ensuite, nous avons quadrillé chaque différence. Ensuite, nous avons ajouté ces résultats. Ensuite, nous avons divisé par le Dfbentre qui est 2 dans cet exemple.
Ne laissez pas les formules vous effrayer.
Troisième Étape
Ensuite, nous pouvons calculer la variance entre les groupes ou s^2 ENTRE
s^2 ENTRE =s^2M *n =.09 * 70 = 6.3
Rappelez-vous, le s ^ 2M vient d’être calculé dans la deuxième étape. Le « n » est la taille de chaque échantillon de groupe. Si vos groupes sont de tailles différentes, utilisez la taille moyenne.
Quatrième étape
Maintenant, nous allons calculer la variance À L’INTÉRIEUR appelée s^2WITHIN
s^2WITHIN = (4.4 + 5.2 + 6.1)/3 = 5.233
D’où viennent ces chiffres ?
Voici les trois variances individuelles de chaque groupe. Voir le tableau au début de l’exemple. Vous verrez que le groupe 1 a une variance (s^ 2) de 4,4 et le groupe 2 a une variance ou 5,2, et le groupe 3 a une variance de 6,1. Pour obtenir la moyenne des trois variances de groupe, nous les additionnons et divisons par 3. C’est ce que nous avons fait ici dans la quatrième étape.
Dernière étape!
Maintenant, nous sommes prêts à calculer F car nous avons calculé toutes les parties dont nous avons besoin pour F.
F = s^2ENTRE /s^2DANS
F = 6.3/5.233 = 1.20
Qu’avons-nous fait ici ?
Le s ^ 2 ENTRE est ce que nous avons calculé à la troisième étape ci-dessus et le s^ 2WITHIN est ce que nous avons calculé à la quatrième étape ci-dessus.
Le test F est la variance entre divisée par la variance à l’intérieur.
Le résultat de notre test F est ici de 1,20
Étape 5: Déterminez le résultat final et la conclusion de votre test F ANOVA
Le test F est de 1,20.
La valeur de coupure est de 3,07
Nous ne pouvons rejeter Ho que lorsque notre valeur de test (1,20 dans ce cas) est SUPÉRIEURE À notre valeur de coupure (3,07 dans ce cas).
Cependant, dans notre exemple ici, la coupure du test F <
1.20 < 3.07
Par conséquent, nous NE POUVONS PAS rejeter Ho
En conclusion, il n’y a PAS de différence significative entre nos trois groupes.
Nous pouvons dire qu’il n’y a pas assez de preuves pour conclure que les personnes des trois groupes d’Italiens, de Français et d’Américains boivent une quantité de café sig diff par jour. Par conséquent, statistiquement, nous disons que la quantité de café consommée par ces groupes n’est PAS sig diff.