Test de corrélation : formule


Définition

Le test de corrélation permet d’étudier l’association (ou dépendance) entre deux ou plusieurs variables. Par exemple, lorsque l’on souhaite savoir s’il y a une association entre les poids des enfants et de leurs pères, le coefficient de corrélation peut être calculé pour répondre à cette question.

S’il n’y a aucun lien entre les deux variables (les poids des pères et des enfants), le poids moyen des enfants devrait être le même quelque soit le poids du père et vice versa.

Il existe différentes méthodes pour l’analyse de corrélations : les tests de Pearson, de kendall et de Spearman.

Le test de corrélation de Pearson est le plus couramment utilisé. L’objectif de cet article est de décrire la formule de calcul du coefficient de corrélation de Pearson.

Corrélation de Pearson

La corrélation de Pearson mesure une dépendance linéaire entre deux variables (x et y). C’est une méthode dite paramétrique car elle dépend de la distribution des données. Cette méthode n’est conseillée que lorsque les variables suivent une loi normale. Dans le cas contraire, il faudrait utiliser les tests de corrélation non-paramétriques de type kendall et Spearman. Le graphique de y = f(x) est appelé droite de régression.

La formule de la corrélation de Pearson est :

\[ r = \frac{\sum{(x-m_x)(y-m_y)}}{\sqrt{\sum{(x-mx)^2}\sum{(y-my)^2}}} \]

\(m_x\) et \(m_y\) représentent les moyennes des variables x et y.

La p-value ( ou niveau de significativité) de la corrélation peut être déterminée:

  1. en utilisant la table des valeurs critiques de coefficient de corrélation pour un degré de liberté : \(dl = n-2\)

  2. ou en calculant la valeur t de Student : \[ t=\frac{r}{\sqrt{1-r^2}}\sqrt{n-2} \]

Dans ce cas la p-value correspondante est déterminée en utilisant la table de Student pour \(dl = n-2\)

Si la p-value est inférieure à 5%, la corrélation est dite significative.

Interprétation du coefficient de corrélation

Le coefficient de corrélation est comprise entre -1 (forte corrélation négative) et 1 (forte corrélation positive)

plot of chunk plotplot of chunk plotplot of chunk plot

Calculateur de coefficient de corrélation

Notez qu’un logiciel web est disponible pour calculer les différents types de corrélation sans aucune installation. Suivez ce lien : Calculateur de coefficient de corrélation.



Enjoyed this article? I’d be very grateful if you’d help it spread by emailing it to a friend, or sharing it on Twitter, Facebook or Linked In.

Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Avez vous aimé cet article? Je vous serais très reconnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami ou en le partageant sur Twitter, Facebook ou Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!





Cette page a été vue 32516 fois