Test de Student apparié avec R : Comparaison de moyennes de deux séries appariées

Introduction

Le test de Student apparié permet de comparer les moyennes de deux séries de valeurs présentant un lien.

Un format simplifié de la fonction R à utiliser est :

t.test(x, y, paired=TRUE)

x et y correspondent, respectivement, aux deux séries de valeurs à comparer. Ce sont des vecteurs de type numéric.

La fonction t.test est décrite en détails ici.

Exemple de données

10 souris ont reçu un traitement X grossissant pendant 3 mois. Leur poids a été mesuré avant et après traitement. Pour chaque souris on a donc deux valeurs (l’une avant et l’autre après traitement).

Les données sont présentées ci-dessous:

poids_avant poids_apres
Souris_1 235.20 464.40
Souris_2 221.80 351.60
Souris_3 200.30 416.90
Souris_4 183.90 403.80
Souris_5 185.90 415.90
Souris_6 202.90 386.40
Souris_7 202.60 398.50
Souris_8 193.60 423.40
Souris_9 208.80 362.40
Souris_10 179.40 372.30

La question est de savoir si le poids des souris a significativement changé après les 3 mois de traitement?.

Il s’agit bien d’un test de Student apparié car les deux mesures à comparer proviennent des même souris.

Calcul du test de Student non-apparié avec R

Le test de Student peut être effectué avec le code R suivant :

# Poids des souris avant traitement
x<-c(200.1, 190.9, 192.7, 213, 241.4, 196.9, 172.2, 185.5, 205.2, 193.7)
# Poids des souris après traitement
y<-c(392.9, 393.2, 345.1, 393, 434, 427.9, 422, 383.9, 392.3, 352.2)
res<-t.test(x, y, paired=TRUE)
res

    Paired t-test
data:  x and y
t = -20.88, df = 9, p-value = 6.2e-09
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -215.6 -173.4
sample estimates:
mean of the differences 
                 -194.5 

Dans le résultat ci-dessus : t est la statistique de Student (t = -20.88), df est le degré de liberté (df= 9), p-value est le degré de significativité du test (p-value = 6.2 × 10-9). L’intervalle de confiance de la différence des moyennes à 95% est également montrée (intervalle de confiance= [-215.56, -173.42]); et enfin, on a la valeur moyenne de la différence des deux séries (moyenne de la différence = -194.49).


La p-value du test est de 6.2003 × 10-9. Ce qui est largement inférieur à 0.05. On conclut que le poids moyen des souris avant traitement est significativement différent de celui après traitement avec une p-value = 6.2003 × 10-9.

Acceder aux valeurs retournées par la fonction t.test

Comme indiquer ici, on peut facilement accéder aux valeurs retournées par la fonction t.test():

# Affichage de la p-value
res$p.value
[1] 6.2e-09
# Affichage de la moyenne
res$estimate
mean of the differences 
                 -194.5 
# Affichage de l'intervalle de confiance
res$conf.int
[1] -215.6 -173.4
attr(,"conf.level")
[1] 0.95

Test de Student non-apparié en ligne


Noter qu’un logiciel web est disponible ici pour faire le test de Student apparié en ligne sans aucune installation.


Infos

Cette analyse a été faite avec R (ver. 3.1.0).







Want to Learn More on R Programming and Data Science?

==> Subscribe to our Mailing List <==

* indicates required


 Get involved :
  Click to follow us on and Google+ :   
  Comment this article by clicking on "Discussion" button (top-right position of this page)
  Sign up as a member and post news and articles on STHDA web site.


Suggestions



Cette page a été vue 10461 fois
Licence - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions
Licence Creative Commons