STHDA forum

R » Probleme chargement de donn?es sous R

Booster Fronde

rank_0.png

Avatar

Inscrit le: 06/08/2012

Messages: 4

Le 07/08/2012 à 15h18
Bonjour,

j'ai un fichier en format csv
la premiere ligne comporte les titres pour chaque colonne
les lignes suivantes les donn?es
quand je charge les donn?es dans une matrice avec cette commande :

creuseC <- read.table("/home/eboumg/Bureau/proprete/creuse_C.csv", header=TRUE, sep=";", na.strings="NA", dec=".", strip.white=TRUE)

il me met l'erreur :

[56] ERREUR: les duplications dans 'row.names' ne sont pas autoris?es

erreur que je ne comprend pas, les titres pour une lignes sont les suivantes :
systeme;cpu_info;cpu_model;vitesse_cpu;GPU;flag optimisation;compilateur;stockage matrice;forme;nombre_elt;dim1;dim2;type matrice;temps execution

Cordialement.
   

Administrateur

rank_admin.png

Avatar

Inscrit le: 16/05/2010

Messages: 11

Le 08/08/2012 à 15h15
Bonjour,

La premi?re colonne de ton tableau de donn?e est consid?r?e automatiquement comme nom de ligne (row names, en anglais) dans R. Le probl?me c'est qu'elle contient des doublons et c'est interdit en programmation R d'avoir des doublons dans les noms de lignes.

Je vous propose d’ins?rer une colonne suppl?mentaire au d?but de vos donn?es et de mettre 1, 2, 3, 4, ..... comme noms de lignes.

Ou alors, essayez la commande suivante (j'ai ajout? row.names=NULL, pour dire que les donn?es noms pas de noms de ligne. R ajoutera automatiquement des noms de lignes correspondant aux rangs des lignes) :

Code R :
 
creuseC <- read.table("/home/eboumg/Bureau/proprete/creuse_C.csv",
                    header=TRUE, row.names=NULL,
                    sep=";", na.strings="NA", dec=".", strip.white=TRUE)
 
Site web    

Booster Fronde

rank_0.png

Avatar

Inscrit le: 06/08/2012

Messages: 4

Le 09/08/2012 à 15h19
STHDA :
Bonjour,



La premi?re colonne de ton tableau de donn?e est consid?r?e automatiquement comme nom de ligne (row names, en anglais) dans R. Le probl?me c'est qu'elle contient des doublons et c'est interdit en programmation R d'avoir des doublons dans les noms de lignes.



Je vous propose d’ins?rer une colonne suppl?mentaire au d?but de vos donn?es et de mettre 1, 2, 3, 4, ..... comme noms de lignes.



Ou alors, essayez la commande suivante (j'ai ajout? row.names=NULL, pour dire que les donn?es noms pas de noms de ligne. R ajoutera automatiquement des noms de lignes correspondant aux rangs des lignes) :



Code R :
 
creuseC <- read.table("/home/eboumg/Bureau/proprete/creuse_C.csv",
                    header=TRUE, row.names=NULL,
                    sep=";", na.strings="NA", dec=".", strip.white=TRUE)
 




Oui effectivement, j'utilise R_commander et j'avais aussi des probl?me ? la fin de chaque ligne de mon fichier csv maintenant j'arrive ? tout importer comme il faut.

Mais l'ACP finallement n'est pas la m?thode id?ale pour analyser mes donn?es je vais donc utiliser la m?thode ACM, puisqu'elle g?re des donn?es qualitatives.

Je voulais utiliser la fonction rquery.mca, j'ai donc transform? avec un script mon fichier csv en fichier texte en rempla?ant les ; par des tabulations.

La premi?re case de mon fichier csv est vide et sur la premi?re colonne j'ai des num?ros id (1,2,3,...) pour ?tre conforme aux format de fichier demand? donc mon fichier txt est comme suit :

vide systeme cpu_info cpu_model vitesse_cpu GPU flag_optimisation compilateur stockage_matrice forme nombre_elt dim1 dim2 type_matrice temps_execution



et sur la ligne suivante se trouvent les donn?es.



seulement quand je lance la fonction rquery.mca, et qu'il me demande le nom de mon fichier je lui met : Bureau/proprete/donnees.txt



et l? il me renvoie un message d'erreur : ERREUR: colonnes non d?finies s?lectionn?es

je ne comprend pas pourtant dans le fichier d'exemples les noms de colonnes sont bien pr?sents.



Cordialement.
   

Administrateur

rank_admin.png

Avatar

Inscrit le: 16/05/2010

Messages: 11

Le 09/08/2012 à 17h07
Il y a un probl?me dans tes donn?es. Envoyez tout ou une partie de vos donn?es pour que je puisse voir la structure.

Ce n'est pas un probl?me li? ? RQuery.

Pour faire de l'ACM sur R, vous pouvez ?galement utiliser les commandes suivantes :

Code R :
 
library(FactoMineR)
data(tea)
res.mca=MCA(tea,quanti.sup=19,quali.sup=20:36)
 


1- Copiez-collez le code ci-dessous dans R. Normalement ?? marche.

2-Essayez ensuite le m?me code sur vos donn?es. Si ?? ne marche pas c'est que vos donn?es sont mal structur?es.




Site web    

Booster Fronde

rank_0.png

Avatar

Inscrit le: 06/08/2012

Messages: 4

Le 10/08/2012 à 09h08
Bonjour,

oui effectivement je pense avoir compris d'o? venait le probl?me sans pour autant arriver ? trouver une solution.
Parmis mes donnees, il y en a qui ont des espaces, par exemple dans cpu_info les donn?es sont de cette forme :
Intel(R) Celeron(R) CPU E3400 @ 2.60GHz
et ? mon avis pour lui ?a correspond a 6 donnees differentes pourtant elles appartiennent ? la m?me colonnes.
Avez-vous une id?e de comment r?soudre ce probl?me ?

Cordialement.
   
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie
1 Utilisateur en ligne : 0 Administrateur, 0 Modérateur, 0 Membre et 1 Visiteur
Utilisateur en ligne : Aucun membre connecté
Licence - Pas d?Utilisation Commerciale - Partage dans les M?mes Conditions
Licence Creative Commons