Une opération courante quand on travaille avec des variables qualitatives (de type factor ou character) est de modifier les valeurs des modalités de cette variable. Ceci permet de les rendre plus courtes, plus explicites, ou même de les regrouper si on leur attribue le même nom. La fonction fct_recode, de l’extension forcats (qui fait partie du tidyverse) facilite ce type d’opérations. Celle-ci prend en premier argument un vecteur, puis une série de recodages sous la forme Nouvelle valeur = Ancienne valeur. Exemple : library(forcats) f <- c(« Fraise », « Framboise », « Pomme », « Fraise ») f <- fct_recode(f, « Ananas » = « Fraise », « Poire » = « Pomme ») f [1] Ananas Framboise Poire AnanasRead More →

Avec R, il est tout à fait possible de réaliser une multiple importation des fichiers CSV (autres types de fichiers). La fonction ci-dessous utilise les fonctions bind_rows et la syntaxe de la librairie dplyr. multmerge <- function(mypath = getwd()){ require(dplyr) dataset <- list.files(path=mypath, full.names=TRUE, pattern= »\.csv ») %>% lapply(read.csv, header=TRUE, sep= »t ») %>% bind_rows() dataset } Dans cette fonction, l’objet mypath indique l’emplacement où se trouve tous les fichiers CSV. Par défaut, la fonction va chercher dans l’espace de travail actuel (getwd). Il est possible de le modifier manuel comme ci-dessous:  mydata <-  multmerge(mypath= »Nom/Du/Chemin/Des/Fichiers »)Read More →

Pour importer un fichier SAS sas7bdat, la premiere solution est d’utiliser la fonction read.sas7bdat du package sas7bdat library(sas7bdat)donnee<-read.sas7bdat(« fichier.sas7bdat ») Cependant parfois  vous allez tomber sur cette erreur : Error in read.sas7bdat(« ficher.sas7bdat ») : file contains compressed data En effet le package sas7bdat n’est pas capable d’importer les fichiers compressés.Voici une solution qui fonctionne : library(devtools)install_github(« biostatmatt/sas7bdat.parso »)library(sas7bdat.parso) s7b2csv(« fichier.sas7bdat », « fichier.csv ») donnee<-read.csv(« fichier.csv »)  Read More →

la parallélisation des calculs, permet d’exploiter au maximum les capacité calculatoire de votre ordinateur en utilisant tous les core de votre machine ( dual core , quad core …)Cette facpon de proceder est rentable si le calcul que vous voulez faire prend plus de temps que le fait de mettre en place la parallélisation library(foreach)library(doSNOW) getDoParWorkers() registerDoSNOW(makeCluster(4, type = « SOCK »))# 2 , 4 ou plus en fonction de votre machine getDoParWorkers() N <- 10^4 system.time(foreach(i = 1:N,.combine = « cbind ») %do% {sum(rnorm(N))}) system.time(foreach(i = 1:N,.combine = « cbind ») %dopar% {sum(rnorm(N))})Read More →