Plusieurs façon de faire, à vous de choisir celle qui vous plait le plus 🙂 Fabriquons un petit jeu de données auquel nous souhaitons ajouter une colonne contenant le nombre ne NA sur chacune des lignes. library(tidyverse) dataset <- tribble(~a,~b,~c, 1,NA,NA, NA,NA,NA, 1,2,3, NA,3,NA ) A l’ancienne dataset$nb <- apply(dataset, MARGIN = 1, function(x){sum(is.na(x))}) avec du pmap et du mutate dataset %>% mutate(nb = pmap(.,function(a,b,c){sum(is.na(a),is.na(b),is.na(c))}), nb= unlist(nb)) Mais c’est dommage de devoir spécifier a, b et c. donc simplifions : dataset %>% mutate(nb = pmap_dbl(., function(…){sum(is.na(c(…)))})) Cela reste à mon goût un peu trop verbeux Avec rowSums dataset %>% mutate(nb = rowSums(is.na(.))) ça c’est propreRead More →

Une opération courante quand on travaille avec des variables qualitatives (de type factor ou character) est de modifier les valeurs des modalités de cette variable. Ceci permet de les rendre plus courtes, plus explicites, ou même de les regrouper si on leur attribue le même nom. La fonction fct_recode, de l’extension forcats (qui fait partie du tidyverse) facilite ce type d’opérations. Celle-ci prend en premier argument un vecteur, puis une série de recodages sous la forme Nouvelle valeur = Ancienne valeur. Exemple : library(forcats) f <- c(« Fraise », « Framboise », « Pomme », « Fraise ») f <- fct_recode(f, « Ananas » = « Fraise », « Poire » = « Pomme ») f [1] Ananas Framboise Poire AnanasRead More →

Avec R, il est tout à fait possible de réaliser une multiple importation des fichiers CSV (autres types de fichiers). La fonction ci-dessous utilise les fonctions bind_rows et la syntaxe de la librairie dplyr. multmerge <- function(mypath = getwd()){ require(dplyr) dataset <- list.files(path=mypath, full.names=TRUE, pattern= »\.csv ») %>% lapply(read.csv, header=TRUE, sep= »t ») %>% bind_rows() dataset } Dans cette fonction, l’objet mypath indique l’emplacement où se trouve tous les fichiers CSV. Par défaut, la fonction va chercher dans l’espace de travail actuel (getwd). Il est possible de le modifier manuel comme ci-dessous:  mydata <-  multmerge(mypath= »Nom/Du/Chemin/Des/Fichiers »)Read More →

Pour importer un fichier SAS sas7bdat, la premiere solution est d’utiliser la fonction read.sas7bdat du package sas7bdat library(sas7bdat)donnee<-read.sas7bdat(« fichier.sas7bdat ») Cependant parfois  vous allez tomber sur cette erreur : Error in read.sas7bdat(« ficher.sas7bdat ») : file contains compressed data En effet le package sas7bdat n’est pas capable d’importer les fichiers compressés.Voici une solution qui fonctionne : library(devtools)install_github(« biostatmatt/sas7bdat.parso »)library(sas7bdat.parso) s7b2csv(« fichier.sas7bdat », « fichier.csv ») donnee<-read.csv(« fichier.csv »)  Read More →