Corr?lation et R?gression Poster un commentaire 

Corr?lation et r?gression : Test d'ind?pendance

Logiciel

Pour voir le logiciel correspondant ? ce cour cliquer sur ce lien Corr?lation - logiciel

Principe

On souhaite savoir, s'il existe un lien entre la taille et le poids d'un homme. La repr?sentation de la taille en fonction du poids ou vice-versa esr appel?e droite de regression.

s'il n'ya aucun lien entre les deux param?tres, la taille moyenne des individus doit ?tre la m?me quelque soit le poids et reciproquement le poids moyen doit ?tre le m?me quelque soit la taille des individus.

Determination de la droite de regression

La pente P

La droite de r?gression y=f(x) passe par le point de coordonn?es (mx , my) et a pour pente p : pente mx et my ?tant les moyennes de x et de y respectivement.

Le coefficient de corr?lation r:

coefficient-correlation Sx et Sy sont les ?carts-types observ?s de x et y test-r

en rempla?ant Sx et Sy par leur valeur dans la formule de r on a :

r = covariance(x, y)/racine(variance x * variance y).

Test du coefficient de corr?lation r:

La pvalue correspondant ? r peut ?tre obtenue, soit par la table du coefficient de corr?lation pour ddl =n-2, soit en calculant la valeur de student t:

student

et en cherchant le risque correspondant dans la table de t pour ddl=n-2 ou dans excel avec la formule : loi.student(t, ddl, 1 ou 2); 1 pour un test unilateral et 2 pour un test bilat?ral.

Corr?lation non param?trique

La formule de corr?lation ci-dessus repr?sente le coefficient de corr?lation r de Pearson. Elle est dite param?trique car elle depend de la moyenne et de l'?cart type qui sont beaucoup influenc?s par l'amplitude des observations (les valeurs extr?mes ou outliers). Lorsque l'on a des variables discr?tes, ordinales ou lorsque l'on ne veut pas une corr?lation influenc?e par les outliers, on fait recour aux corr?lations non param?triques.

Coefficient de corr?lation non param?trique de Spearman

Soit deux variables X et Y pour lesquelles on veut determiner le coefficient de corr?lation. Le principe consiste ? trier dans l'ordre croissant les observations X et Y et ? remplacer les valeurs par le rang. On obtient donc 2 nouvelles variables X' et Y'. Ensuite on determine le coefficient de corr?lation classique pr?senter ci-dessus (Pearson). On demontre ? partir de la formule ci dessus du coefficient de corr?lation (r) de Pearson, que le coefficient de corr?lation de Spearman (rho) peut ?tre determin? simplement en appliquant la formule ci-dessous: correlation spearman di represente les diff?rences y'i-x'i des rangs. Pour tester la significativit? de la corr?lation on applique la m?me formule que celle utilis?e pour le coefficient de corr?lation de pearson (voir la section test du coefficient de corr?lation r)

Coefficient de corr?lation non param?trique de Kendall

On compare 2 variables X et Y. Le principe consiste ? trier une des variables dans l'ordre croissant, par exemple X. Par la suite on ne s'interesse qu'? l'autre s?rie. Par exemple Y. On regarde si les valeurs de la s?rie Y sont dans l'ordre naturel ou pas.

X Y
5 9
9 1
11 10
12 3
17 13

Pour chaque valeur de la variable Y, on determine le nombre de valeurs suivantes qui lui est inf?rieur (Ninf) ( dans ce cas on attribue le score -1 car cela n'est pas l'ordre naturel) et le nombre de valeurs suivantes qui lui est sup?rieur (Nsup)( dans ce cas on attribue le score +1). On a donc un score pour chaque valeur de la variable Y qui est = Nsup-Ninf. Le coefficient de corr?lation Tau de Kendall est d?fini comme ?tant : (Total des Scores)/(Maximum Possible) correlation de kendall S represente le score total et n le nombre d'?chantillon (la taille de X et de Y)

Test de signification du coefficient de corr?lation de Kendall

Lorsque N>10, on peut determiner la valeur statistique Z : Test de signification de kendall

NB:

Pour la corr?lation non param?trique : Dans le cas des ex-aequo, les valeurs re?oivent le rang moyen des rang qu'elles auraient pu avoir lorsqu'elles n'?taient pas li?es.

Liens utiles

http://www.cons-dev.org/elearning/stat/stat7/st7.html

Cette page a été consultée 3943 fois
Licence - Pas d?Utilisation Commerciale - Partage dans les M?mes Conditions
Licence Creative Commons