Comment filtrer un jeu de données avec dplyr ? : filter()

Avec ce package du tidyverse, vous pouvez filtrer votre jeu de données pour ne retenir que les valeurs qui vous intéressent, grâce à la fonction filter().

Cette fonction prend en paramètres votre objet contenant un tableau de données, puis une ou plusieurs variable(s) avec leurs filtres. Vous pouvez utiliser tous les opérateurs classiques (==, !=, >, <, etc.)

data(women)
women %>%
filter(height == 59)
women %>%
filter(height > 59 & weight < 139)

Vous pouvez également « piper » vos filtres. Utile pour une meilleure lisibilité, si vous voulez combiner beaucoup de conditions (mais vous aurez plus de ligne  :

women %>%
filter(height > 59) %>%
filter(weight < 139)