Test de student - Formules

Introduction au test t de Student

Le test-t de Student est un test statistique permettant de comparer les moyennes de deux groupes d’échantillons. Il s’agit donc de savoir si les moyennes des deux groupes sont significativement différentes au point de vue statistique.

Il existe plusieurs variants du test-t de Student:

  • Le test-t de Student pour échantillon unique
  • Le test-t de Student comparant deux groupes d’échantillons indépendants ( on parle de test de Student non apparié)
  • Le test-t de Student comparant deux groupes d’échantillons dépendants (on parle de test de Student apparié).

Cet article a pour objectif de décrire les formules pour les différents types de test de Student. Le test de Student est dit paramétrique car, comme nous allons le voir, la formule dépend de la moyenne et de l’écart-type des observations à comparer.

Noter qu’un logiciel web est disponible ici pour faire le test de Student en ligne sans aucune installation.

Test de Student pour échantillon unique

Il s’agit de comparer une moyenne observée à une moyenne théorique (\(\mu\)).

Soit X une série de valeurs de taille n, de moyenne m et d’écart-type S. La comparaison de la moyenne observée (m) à une valeur théorique \(\mu\) est donnée par par la formule :

\[ t = \frac{m-\mu}{s/\sqrt{n}} \]

Pour savoir si la différence est significative, il faut tout d’abord lire dans la table t, la valeur critique correspondant au risque alpha = 5% pour un degré de liberté :

\[ d.d.l = n - 1 \]

Si la valeur absolue de t (|t|) est supérieure à la valeur critique, alors la différence est significative. Dans le cas contraire, elle, ne l’est pas. Le degré de siginificativité (ou p-value) correspond au risque indiqué par la table de Student pour la valeur |t|.

Le test n’est applicable que si seulement si la série de valeurs X suit une loi normale.

Test t de Student pour échantillons indépendants

Dans ce cas de figure, il s’agit de comparer deux moyennes observées. Lorsque les deux groupes d’échantillons (A et B) à comparer n’ont aucun lien, on utilise le test t de Student indépendant (ou non apparié).

C’est quoi le test de Student non-apparié ?

A titre d’exemple, nous avons un groupe de 100 individus (50 femmes et 50 hommes) pris au hasard au sein de la population. On se pose la question à savoir si le poids moyen des femmes est significativement différent de celui des hommes?

Dans cet exemple on parle de test de Student non apparié car les deux groupes à comparer n’ont aucun lien. Il s’agit donc de calculer le poids moyen des femmes et de celui des hommes et d’évaluer si la différence est significative au point de vue statistique.

Formule

  • Soit A et B deux groupes différents à comparer.
  • Soit \(m_A\) et \(m_B\) la moyenne du groupe A et celui du groupe B, respectivement.
  • Soit \(n_A\) et \(n_B\) la taille du groupe A et celle du groupe B, respectivement.

La valeur t de Student est donnée par la formule suivante:

\[ t = \frac{m_A - m_B}{\sqrt{ \frac{S^2}{n_A} + \frac{S^2}{n_B} }} \]

\(S^2\) est la variance commune aux deux groupes. Elle est calculée par la formule suivante :

\[ S^2 = \frac{\sum{(x-m_A)^2}+\sum{(x-m_B)^2}}{n_A+n_B-2} \]

Pour savoir si la différence est significative, il faut tout d’abord lire dans la table t, la valeur critique correspondant au risque alpha = 5% pour un degré de liberté :

\[ d.d.l = n_A + n_B -2 \]

Si la valeur absolue de t (|t|) est supérieure à la valeur critique, alors la différence est significative. Dans le cas contraire, elle, ne l’est pas. Le degré de siginificativité ou p-value correspond au risque indiqué par la table de Student pour la valeur |t|

Le test est utilisable, si seulement si, A et B suivent des lois normales de même variances.

Lorsque les variances des deux groupes à comparer sont différentes, le test t de Welch est préconisé.

Test-t de Student pour séries appariés

C’est quoi le test de Student apparié ?

Le test de Student apparié permet de comparer la moyenne de deux séries de valeurs ayant un lien.

Par exemple, 20 souris ont reçu un traitement X pendant 3 mois. On se pose la question à savoir si le traitement X a un impact sur le poids des souris au bout des 3 mois. Le poids des 20 souris a donc été mesuré avant et après traitement. Ce qui nous donne 20 séries de valeurs avant traitement et 20 autres séries de valeurs après traitement provenant de la mesure du poids des mêmes souris.

Il s’agit bien dans cet exemple, d’un test de Student apparié car les deux séries de valeurs ont un lien (les souris). Pour chaque souris, on a deux mesures (l’une avant et l’autre après traitement).

Formule

Pour comparer les moyennes de deux séries appariées, on calcule tout d’abord la différence des deux mesures pour chaque paire.

Soit d la série des valeurs correspondant aux différences des mesures entre les paires de valeurs. La moyenne de la différence d est comparée à la valeur 0. S’il y a une différence significative entre les deux séries appariées, la moyenne de d devrait être très éloignée de la valeur 0

La valeur t de Student est donnée par la formule :

\[ t = \frac{m}{s/\sqrt{n}} \]

m et s représentent la moyenne et l’écart-type de la différence d. n est la taille de la série d.

Pour savoir si la différence est significative, il faut tout d’abord lire dans la table t, la valeur critique correspondant au risque alpha = 5% pour un degré de liberté :

\[ d.d.l = n - 1 \]

Si la valeur absolue de t (|t|) est supérieure à la valeur critique, alors la différence est significative. Dans le cas contraire, elle, ne l’est pas. Le degré de siginificativité (ou p-value) correspond au risque indiqué par la table de Student pour la valeur |t|.

Le test est utilisable, si seulement si, la différence de suit une loi normale.

Test de Student en ligne

Vous n’avez plus besoin de SPSS ou d’ Excel pour faire le test t de Student.

Un logiciel web est disponible ici pour faire le test de Student en ligne sans aucune installation. Vous devez juste être membre du site et être connecté.

En fonction du type de test de Student que vous souhaitez faire, cliquez sur les liens suivant :

Infos

Cette analyse a été faite avec R (ver. 3.1.0).


Enjoyed this article? I’d be very grateful if you’d help it spread by emailing it to a friend, or sharing it on Twitter, Facebook or Linked In.

Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Avez vous aimé cet article? Je vous serais très reconnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami ou en le partageant sur Twitter, Facebook ou Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!






Cette page a été vue 66593 fois