Comment comparer deux moyennes avec R grâce au test de Student ? t.test

Le test de Student permet de tester l’égalité de deux moyennes. L’hypothèse H0 est « les moyennes sont égales » ou « la moyenne vaut une valeur x ».

Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire de chaque individu et que les ces deux échantillons suivent une loi Normale. Pour tester l’hypothèse H0 on utilise la fonction t.test().


data(iris) A<-subset(iris,Species=="setosa")[,2] #On isole la 2ème colonne : la largeur des sépales

 

On commence par tester la normalité de cette variable grâce au test de Shapiro :


shapiro.test(A)           Shapiro-Wilk normality test   data:  A W = 0.9717, p-value = 0.2715

 

La p-value est supérieur à 0.05 on accepte donc l’hypothèse de normalité : la variable correspondant à la largeur des sépales suit donc une loi Normale.

On compare la moyenne de la variable et la valeur de 0.5cm :


t.test(x=A,mu=0.5)           One Sample t-test   data:  A t = 54.6189, df = 49, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 0.5 95 percent confidence interval:  3.320271 3.535729 sample estimates: mean of x     3.428

Nous constatons que la p-value est bien supérieure à 0.05, nous rejetons donc l’hypothèse H0 : moy(Sepal.Width) = 0.05, la moyenne de cette variable est donc significativement différente de 0.05.

Nous comparons la moyenne de la longueur des sépales des espèces setosa et versicolor :


#On isole les 100 premières lignes qui correspondent aux données des espèces Setosa et Versicolor. t.test(Sepal.Length~Species, data=iris[1:100,])           Welch Two Sample t-test   data:  Sepal.Length by Species t = -10.521, df = 86.538, p-value < 2.2e-16 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:  -1.1057074 -0.7542926 sample estimates:     mean in group setosa mean in group versicolor                    5.006                    5.936

 
La probabilité critique est inférieure à 0.05 (< 2.2e-16). Nous rejetons donc l’hypothèse H0 : moy(Sepal.Width)setosa = moy(Sepal.Width)versicolor. Cela signifie qu’en moyenne, la longueur des sépales est significativement différente d’une espèce à l’autre. La longueur des sépales dépend donc de l’espèce de l’Iris.