colin, Author at Astuces et scripts R

12 mai

Le mai 12, 2017

Comment sélectionner des lignes par leur index ? slice()

Pour sélectionner une série de lignes d’un tableau par leur index, faites appel à la fonction slice() du package dplyr ! Comme tous ses cousins du tidyverse, slice() prend en premier argument le nom du tableau à transformer. Ensuite, vous pouvez sélectionner vos lignes par leur index, avec un vecteur numérique. library(dplyr) data(« presidential ») slice(presidential, 1:25)Read More →

11 mai

Par colin

Le mai 11, 2017

Dans graphique, tidyverse

Avec 0 Commentaire

Comment changer l'échelle d'un axe contenant une date dans ggplot2 ? scale_x_date(break)

Vous souhaitez ne garder que les mois, ou uniquement les années sur votre ggplot ? Vous avez envie de changer le format des étiquettes de l’axe ? Pour cela, direction la fonction scale_x_date(), qui vous permettra de personnaliser votre axe comme vous le souhaitez ! Dans la majorité des cas, vous serez amené à utiliser deux arguments principaux sur scale_x_date (mais il faut savoir qu’il en existe au total 9) : date_breaks, pour la durée entre chaque point principal de l’axe date_label, pour définir le formatage de l’affichage de la légende library(tidyverse) library(ggplot2) library(nycflights13) data % unite(date, year, month, day, sep = « -« ) %>% mutate(date = lubridate::ymd(date))Read More →

10 mai

Par colin

Le mai 10, 2017

Dans graphique, tidyverse

Avec 0 Commentaire

Comment changer l'emplacement de la légende avec ggplot2 ? theme(legend.position)

Vous n’avez plus envie de voir vos légendes sur la droite ? Vous mourrez d’envie de pouvoir personnaliser encore plus votre graphique ? Faites appel à la fonction theme(), et à son argument legend.position — ce dernier vous permet de placer la légende sur le bord que vous désirez. library(ggplot2) data(« iris ») ggplot(iris, aes(x= Sepal.Length, y = Sepal.Width, col = Species)) + geom_point() + theme(legend.position = « bottom ») Les cinq arguments possibles sont les quatre bords, ainsi que la position none, pour faire disparaitre la légende. theme(legend.position = « left ») theme(legend.position = « right ») theme(legend.position = « bottom ») theme(legend.position = « top ») theme(legend.position = « none »)Read More →

05 mai

Par colin

Le mai 5, 2017

Dans tidyverse, Transformation de données

Avec 0 Commentaire

Comment joindre plusieurs colonnes en une ? unite()

Si vous souhaitez unifier plusieurs colonnes en une seule, faites appel à la fonction unite(), issue du package tidyr. Cette fonction prends en premier argument le nom de l’objet contenant le tableau, la colonne cible, les colonnes à lier, puis un éventuel séparateur. Notez que le séparateur de base est « _ ». data(« msleep ») library(tidyr) unite(msleep, genusvore, genus, vore, sep = « -« )Read More →

05 mai

Par colin

Le mai 5, 2017

Dans manipulation de données, tidyverse

Avec 0 Commentaire

Comment séparer une colonne ? separate()

Votre colonne contient deux variables (ou plus), et vous avez besoin de la séparer ? Pour transformer xx_yy en deux colonnes qui contiendront xx et yy, faites appel à la fonction separate() du package tidyr ! separate prend quatre arguments principaux : le tableau, le nom de la colonne à séparer, les noms des colonnes cibles, et le séparateur. library(tidyr) data(« presidential ») separate(presidential, start, c(« y », »m », « d »), sep = « -« )Read More →

05 mai

Par colin

Le mai 5, 2017

Dans manipulation de données, tidyverse

Avec 0 Commentaire

tibble ou data.frame ?

Commençons par un point important : un tibble est un data.frame… mais un data.frame amélioré ! Élément central du tidyverse, cette forme diffère des data.frame natifs dans deux comportements : l’affichage : les tibbles s’adaptent à l’écran, et chaque colonne affiche son type. la sélection : elle est plus stricte dans un tibble — elle ne se fait jamais en partial match, et un message d’erreur s’affiche lorsque vous sélectionner un élément qui n’existe pas. Pour créer un tibble, deux solutions : la conversion depuis un data.frame, ou la création à la main. library(tibble) data(« swiss ») as_tibble(swiss) tibble(x = 1:4, y = 5:8)Read More →

05 mai

Par colin

Le mai 5, 2017

Dans graphique, tidyverse

Avec 0 Commentaire

Comment gérer les titres de mon graphe ggplot ? labs()

La fonction labs(), à utiliser pendant la construction de votre ggplot, vous permet d’intégrer titre, sous-titres, et légendes. ggplot(iris, aes(Sepal.Width, Sepal.Length)) + geom_point() + labs(title = « Mon titre », subtitle = « Mon sous titre n sur deux lignes », caption = « Ma légende », x = « Mon axe x », y = « Mon axe y »)Read More →

05 mai

Par colin

Le mai 5, 2017

Dans graphique, tidyverse

Avec 0 Commentaire

Comment changer la couleur de fond de mon ggplot ? theme(plot.background =)

Pour modifier la couleur de fond de votre graphique avec ggplot, utilisez l’argument suivant dans votre theme() : library(ggplot2) ggplot(iris, aes(Sepal.Width, Sepal.Length)) + geom_point() + theme(plot.background = element_rect(fill = « pink »))Read More →

05 mai

Par colin

Le mai 5, 2017

Dans tidyverse, Transformation de données

Avec 0 Commentaire

Comment créer une nouvelle colonne dans un data.frame ? mutate()

Pour ajouter une colonne, direction la fonction mutate. Avec celle-ci, vous pouvez insérer un objet externe au tableau (par exemple une liste), ou le résultat de l’opération sur une ou plusieurs colonnes. data(« faithfuld ») library(dplyr) mutate(faithful, index= 1:nrow(faithful), er.wa = eruptions / waiting)Read More →

05 mai

Par colin

Le mai 5, 2017

Dans manipulation de données, tidyverse

Avec 0 Commentaire

Comment résumer un jeu de données ? summarise()

Vous avez besoin d’un résumé rapide sur une ou plusieurs variables de votre tableau ? Direction la fonction summarise (ou summarize, selon vos affinités). data(« who ») who %>% summarise(minimum = min(year)) Notez qu’il est possible de combiner plusieurs résumés dans cette fonction. who %>% summarise(minimum = min(year), maximum = max(year))Read More →

Les dates de formations à R, éligibles au CPF sont en lignes !

colin (Page 2)

Comment sélectionner des lignes par leur index ? slice()

Comment changer l'échelle d'un axe contenant une date dans ggplot2 ? scale_x_date(break)

Comment changer l'emplacement de la légende avec ggplot2 ? theme(legend.position)

Comment joindre plusieurs colonnes en une ? unite()

Comment séparer une colonne ? separate()

tibble ou data.frame ?

Comment gérer les titres de mon graphe ggplot ? labs()

Comment changer la couleur de fond de mon ggplot ? theme(plot.background =)

Comment créer une nouvelle colonne dans un data.frame ? mutate()

Comment résumer un jeu de données ? summarise()