Statistiques descriptives avec R

<h2 class="formatter-title wiki-paragraph-2" id="paragraph-la-fonction-summary">La fonction summary()</h2>

La fonction summary() permet d'avoir la description statistique d'une variable ou d'une table de donnée.

Pour une variable donnée, la fonction renvoie 5 valeurs : le minimum (Min.), le premier quartile (1st Qu.), la médiane (Median), la moyenne (Mean), le troisième quartile (3rd Qu.) et le maximum (Max).


<h3 class="formatter-title wiki-paragraph-3" id="paragraph-exemple-1-statistiques-descriptives-d-une-variable">Exemple 1 : Statistiques descriptives d'une variable</h3>


Code R :
 
attach(faithful) # chargement de la table de donnée faithful
summary(eruptions) #description de la variable eruptions
 
#résultat de la commande
 Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.600   2.163   4.000   3.488   4.454   5.100 
 




<h3 class="formatter-title wiki-paragraph-3" id="paragraph-exemple-2-statistiques-descriptives-d-une-table-de-donnee">Exemple 2 : Statistiques descriptives d'une table de donnée</h3>


Code R :
 
attach(faithful) # chargement de la table de donnée faithful
summary(faithful) #description de la table de donnée
 
#résultat de la commande
   eruptions        waiting    
 Min.   :1.600   Min.   :43.0  
 1st Qu.:2.163   1st Qu.:58.0  
 Median :4.000   Median :76.0  
 Mean   :3.488   Mean   :70.9  
 3rd Qu.:4.454   3rd Qu.:82.0  
 Max.   :5.100   Max.   :96.0 
 
 



<h2 class="formatter-title wiki-paragraph-2" id="paragraph-la-fonction-sapply">La fonction sapply()</h2>

La fonction sapply() est généralement utilisée pour appliquer spécifiquement une fonction à une variable ou à une table de donnée.

Ainsi on peut spécifiquement appliquer des fonctions telles que mean (moyenne), sd (écart type), var (variance), min (minimum), max (maximum), med ( médiane), range (l'étendue) et le quantile (quartile 1, 2 , 3, ...).

Exemple

Code R :
 
attach(faithful) # chargement de la table de donnée faithful
 
sapply(faithful, sd) #ecart type de la table de donnée
#résultat de la commande
  eruptions   waiting 
 1.141371 13.594974 
 
sapply(faithful,quantile)# calcul du quantile
#résultat de la commande
     eruptions waiting
0%     1.60000      43 #minimum
25%    2.16275      58 #premier quartile
50%    4.00000      76 #médiane
75%    4.45425      82 #troisième quartile
100%   5.10000      96 # maximum
 
sapply(faithful,range) #calcul de l'étendue (min, max)
     eruptions waiting
[1,]       1.6      43 #minimum
[2,]       5.1      96 #maximum
 
 




« Cours précédent
Transposer une table de données avec R


Cours suivant »
Test de normalité avec R : Test de Shapiro-Wilk


Enjoyed this article? I’d be very grateful if you’d help it spread by emailing it to a friend, or sharing it on Twitter, Facebook or Linked In.

Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Avez vous aimé cet article? Je vous serais très reconnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami ou en le partageant sur Twitter, Facebook ou Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!





Cette page a été vue 48616 fois