• RQuery » probleme pour utiliser la fonction rquery.pca()
Bonjour,
Je d?bute vraiment en r c'est pourquoi pour faire une analyse en composante principale j'ai voulu utiliser la biblio RQuery, et la fonction rquery.pca().
Donc j'ai un fichier de donnees au depart qui etais en .csv de la forme suivant
systeme;cpu_info;cpu_model;vitesse_cpu;GPU;flag d'optimisation;compilateur;stockage matrice;forme;nombre_elt;dim1;dim2;type matrice;temps execution
tout ?a sur une seule ligne (la premi?re ligne correspond aux titres des colonnes les lignes suivantes correspondent aux donn?es) il n'y a que la derni?re colonne qui comportent des donn?es quantitatives, toutes les autres poss?dent des donn?es qualitatives.
J'ai vu que pour utiliser cette fonction il fallait l(appliquer ? des format .txt et que les s?parateur devrait ?tre des espace j'ai donc chang? le format externe et interne de mon fichier de donn?es qui est maintenant sous la forme :
systeme cpu_info cpu_model vitesse_cpu GPU flag d'optimisation compilateur stockage matrice forme nombre_elt dim1 dim2 type matrice temps execution
tout ?a sur une m?me ligne seulement quand je lance la fonction rquery.pca() il me renvoi une erreur :
Erreur dans `rownames<-`(`*tmp*`, value = c("x86_64-pc-linux-gnu Intel(R) Celeron(R) CPU E3400 @ 2.60GHz 23 2593.412 01:00.0 VGA compatible controller: nVidia Corporation GF108 [GeForce GT 430] (rev a1) O0 gcc stockage_2D carree 400000 633 633 DINT 0.0027759473000001 ", :
attempt to set rownames on object with no dimensions
Je pense avoir compris o? ?tait le probl?me mais je ne suis pas sur, il y a dans mon tableau des variables qualitatives qui poss?dent aussi des espaces et il ne sait pas faire la diff?rence entre une variable avec un espace et l'espace qu'il y a entre deux variables diff?rentes c'est pourquoi le d?limiteur ";" ?tait id?al .
Quelqu'un aurait-il une solution au probl?me ou un d?but de solution s'il vous pla?t.
Cordialement.
Je d?bute vraiment en r c'est pourquoi pour faire une analyse en composante principale j'ai voulu utiliser la biblio RQuery, et la fonction rquery.pca().
Donc j'ai un fichier de donnees au depart qui etais en .csv de la forme suivant
systeme;cpu_info;cpu_model;vitesse_cpu;GPU;flag d'optimisation;compilateur;stockage matrice;forme;nombre_elt;dim1;dim2;type matrice;temps execution
tout ?a sur une seule ligne (la premi?re ligne correspond aux titres des colonnes les lignes suivantes correspondent aux donn?es) il n'y a que la derni?re colonne qui comportent des donn?es quantitatives, toutes les autres poss?dent des donn?es qualitatives.
J'ai vu que pour utiliser cette fonction il fallait l(appliquer ? des format .txt et que les s?parateur devrait ?tre des espace j'ai donc chang? le format externe et interne de mon fichier de donn?es qui est maintenant sous la forme :
systeme cpu_info cpu_model vitesse_cpu GPU flag d'optimisation compilateur stockage matrice forme nombre_elt dim1 dim2 type matrice temps execution
tout ?a sur une m?me ligne seulement quand je lance la fonction rquery.pca() il me renvoi une erreur :
Erreur dans `rownames<-`(`*tmp*`, value = c("x86_64-pc-linux-gnu Intel(R) Celeron(R) CPU E3400 @ 2.60GHz 23 2593.412 01:00.0 VGA compatible controller: nVidia Corporation GF108 [GeForce GT 430] (rev a1) O0 gcc stockage_2D carree 400000 633 633 DINT 0.0027759473000001 ", :
attempt to set rownames on object with no dimensions
Je pense avoir compris o? ?tait le probl?me mais je ne suis pas sur, il y a dans mon tableau des variables qualitatives qui poss?dent aussi des espaces et il ne sait pas faire la diff?rence entre une variable avec un espace et l'espace qu'il y a entre deux variables diff?rentes c'est pourquoi le d?limiteur ";" ?tait id?al .
Quelqu'un aurait-il une solution au probl?me ou un d?but de solution s'il vous pla?t.
Cordialement.
Bonjour pdedey,
D'apr?s ce que vous dites vos donn?es sont des variables qualitatives. L'ACP est applicable uniquement sur des variables quantitatives.
Si vous avez surtout des variables qualitatives, il faudrait faire de l'ACM ou de l'AFC en fonction de la configuration des donn?es.
Pour chaque type d'analyses il y a un format de fichier sp?cifique qui est fourni dans les tutos sur RQuery.
Le probl?me se trouve au niveau des noms des lignes du tableau de donn?es. La premi?re colonne de vos donn?es s'appelle "systeme". Elle est consid?r?e automatiquement comme nom de lignes du tableau de donn?es. Le probl?me c'est que la colonne "syst?me" contient plein de caract?res sp?ciaux (des crochets par exemple) pour ?tre import?e comme nom de lignes dans R.
Je vous propose d'ajouter une colonne suppl?mentaire simple comme nom de ligne. Par exemple mettre L1, L2, L3..... comme noms de lignes.
Quoi qu'il en soit, il ne faut pas faire de l'ACP sur des variables qualitatives.
Je vous propose de m'envoyer vos donn?es (au moins partiellement) pour que je puisse mieux vous aider.
Vous pouvez ajouter vos donn?s depuis le forum ou ici.
vous pouvez ?galement m'envoyer vos donn?es ? l'adresse mail_123soft@yahoo.fr
Bon courage
k@ss
Citation :
tout ?a sur une seule ligne (la premi?re ligne correspond aux titres des colonnes les lignes suivantes correspondent aux donn?es) il n'y a que la derni?re colonne qui comportent des donn?es quantitatives, toutes les autres poss?dent des donn?es qualitatives.
D'apr?s ce que vous dites vos donn?es sont des variables qualitatives. L'ACP est applicable uniquement sur des variables quantitatives.
Si vous avez surtout des variables qualitatives, il faudrait faire de l'ACM ou de l'AFC en fonction de la configuration des donn?es.
Pour chaque type d'analyses il y a un format de fichier sp?cifique qui est fourni dans les tutos sur RQuery.
Citation :
Erreur dans `rownames<-`(`*tmp*`, value = c("x86_64-pc-linux-gnu Intel(R) Celeron(R) CPU E3400 @ 2.60GHz 23 2593.412 01:00.0 VGA compatible controller: nVidia Corporation GF108 [GeForce GT 430] (rev a1) O0 gcc stockage_2D carree 400000 633 633 DINT 0.0027759473000001 ", :
attempt to set rownames on object with no dimensions
attempt to set rownames on object with no dimensions
Le probl?me se trouve au niveau des noms des lignes du tableau de donn?es. La premi?re colonne de vos donn?es s'appelle "systeme". Elle est consid?r?e automatiquement comme nom de lignes du tableau de donn?es. Le probl?me c'est que la colonne "syst?me" contient plein de caract?res sp?ciaux (des crochets par exemple) pour ?tre import?e comme nom de lignes dans R.
Je vous propose d'ajouter une colonne suppl?mentaire simple comme nom de ligne. Par exemple mettre L1, L2, L3..... comme noms de lignes.
Quoi qu'il en soit, il ne faut pas faire de l'ACP sur des variables qualitatives.
Je vous propose de m'envoyer vos donn?es (au moins partiellement) pour que je puisse mieux vous aider.
Vous pouvez ajouter vos donn?s depuis le forum ou ici.
vous pouvez ?galement m'envoyer vos donn?es ? l'adresse mail_123soft@yahoo.fr
Bon courage
k@ss
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie