Présentation

À propos de R

R est un langage de programmation destiné aux statistiques et à la science des données. R a plusieurs avantages:

  • il est multiplateforme: fonctionne aussi bien sur des sytèmes Linux, MacOS et Windows,
  • il est gratuit,
  • il est libre, développé par ses utilisateurs, diffusable et modifiable par tout un chacun.

Ce logiciel peut être téléchargé sur le site du CRAN (Comprehensive R Archive Network) à l’adresse suivante https://cran.r-project.org/. Il existe de nombreuses sources d’informations disponibles en ligne.

À propos de RStudio

RStudio est une sur-couche de R (également libre et gratuit) rendant son utilisation plus conviviale. Il peut-être téléchargée sur https://rstudio.com (après avoir téléchargé le logiciel R).

Lorsque vous ouvrez RStudio pour la première fois, l’interface est divisée par défaut en 3 fenêtres:

  • la console interactive R qui sert à exécuter le code (à gauche)
  • l’environnement / histoire qui contient l’espace de travail et l’historique des commandes (en haut à droite)
  • Les Files / Plots / Packages / Help / Viewer (en bas à droite)

Une fois que vous ouvrez des fichiers, tels que des scripts R, l’éditeur s’ouvre au-dessus de la console. Il permet d’écrire du code et de le sauver.

À propos de Rmarkdown

Rmarkdown est un langage à balise qui permet des générer des rapports en mélangeant du texte, du code R et les résultats produits par ce code. En plus de produire des rapports agréables à lire (le code et ses résultats ne sont pas séparés des commentaires qui leur sont associés), son principal avantage est qu’il produit des rapports qui sont dynamiques et qui rendent les travaux reproductibles.

C’est un simple fichier texte dont l’extension est .Rmd. Voici un exemple très simple de document Rmarkdown:

---
  title: "Test R Markdown"
author: "Ana Karina FERMIN"
date: "06/11/2020"
output: html_document
---
  
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```

## Codes R
Les blocs de code sont exécutés et leur résultat s'affiche juste après. Par exemple,
```{r}
summary(cars)
```

```{r}
mean(cars$speed)
```

## Graphes
```{r, out.width = "60%",fig.align='center'}
plot(cars$speed, cars$dist)
```

Les documents peuvent être ‘compilés’ sous différents formats (HTML, PDF, Word). Voici le rendu du document précédent au format HTML :

À propos de tidyverse

Le terme tidyverse est une contraction de tidy (traduit comme “bien rangé”) et de universe. Le tidyverse est un ensemble d’extensions pour R conçues pour fonctionner ensemble. Elle facilitent un très grand nombre d’opérations courantes dans R. Plusieurs packages constituent le coeur de tidyverse:

  • ggplot2 (visualisation)
  • dplyr (manipulation des données)
  • tidyr (remise en forme des données)
  • purrr (programmation)
  • readr (importation de données)
  • tibble (tableaux de données)
library(tidyverse)

Vous avez à disposition des documents synthétiques sur les grammaires des packages purrr, dplyr et tidyr, et ggplot2.

Prise en main de R et Rstudio

Console

Lorsque RStudio est lancé, l’utilisateur se trouve face à la console. C’est une fenêtre de texte qui commence par le signe >, signifiant que le logiciel attend les ordres. On peut commencer par taper quelques opérations simples:

2+3
## [1] 5
sample(10)
##  [1]  3  4  1  6  8  2 10  5  9  7
rnorm(10)
##  [1]  0.9359318  0.2577945  0.7059583 -0.1771677 -2.5169194 -1.0573928
##  [7] -1.0944042  0.6270122  0.8298302 -0.9538768
rbinom(10,1,0.7)
##  [1] 0 1 1 1 0 1 1 1 1 0

En utilisant les flèches ↑ et ↓, on peut rappeler les dernières commandes exécutées.

Chercher de l’aide

Pour chercher de l’aide sur une fonction spécifique

?nom_fonction
# ou
help(nom_fonction)

Cela chargera une page d’aide dans l’onglet Help (en bas à droite).

Installer et charger un package

R est un logiciel très vivant car de nouvelles fonctionnalités lui sont sans cesse ajoutées au travers de petits ensemble de fonction regoupées dans un package. Ainsi chaque personne est libre de contribuer au développement du logiciel. Ces package sont regroupés sur le CRAN et sont accessibles à tous.

Pour installer un package,

  • aller dans l’ongle Package
  • cliquer sur l’onglet Install
  • une fenêtre s’ouvre, indiquer le nom du package à installer dans Package
  • cliquer sur Install Le package sera installé une bonne fois pour toute (installé sur le disque dur de votre ordinateur).

Une fois le package installé, il faudra, à chaque fois que vous ouvrez R, le “charger” avant de pouvoir utiliser les fonctions qu’il propose. Ceci se fait avec la fonction library. Par exemple,

library(rmarkdown)

Attention

Vous pouvez taper des commandes directement dans la console, mais elles seront oubliées lorsque vous fermerez la session. Deux solutions:

  1. entrer les commandes dans un éditeur de script et le sauvegarder. Pour cela, cliquer sur File –> New File –> R Script. Vous pouvez:
  • utilisez le signe # pour commenter (tout ce qui se trouve à droite d’un # est ignoré par R)
  • cliquez sur le bouton Run situé au-dessus du panneau de l’éditeur pour exécuter la ligne en cours et des lignes sélectionnées. Un raccourci consiste à placer le curseur sur la ligne à exécuter ou sélectionner les lignes d’intérêt et faire Ctrl-Entrée.
  1. créer un document Rmarkdown (cf paragraphe suivant).

Document Rmarkdown

Création

Pour créer un document Rmarkdown , cliquer sur File –> New File –> R Markdown et une boîte de dialogue s’ouvre:

  • donner les informations nécessaires à la création de votre document: titre, auteur, format de par défaut. Après avoir appuyé sur “OK”, un fichier .Rmd apparaît dans l’éditeur. Il contient les informations que vous lui avez donné ainsi que du code et du texte par défaut.
  • enregistrez le.

Pour générer le fichier associé, cliquer sur Knit et choisissez le format que vous voulez. Un fichier avec l’extension du format donné portant le même nom que fichier.Rmd est alors créé dans le même directory et en même temps le rapport généré s’ouvre dans le viewer de RStudio.

La personnalisation du document généré se fait en modifiant des options dans le préambule du document. RStudio propose néanmoins une petite interface graphique permettant de changer ces options plus facilement. Pour cela, cliquez sur l’icône en forme d’engrenage à droite du bouton Knit et choisissez Output Options.

Texte

Pour écrire

- en gras: **gras**,
- en italique: _italics_.

Pour créer une liste numérotée, il suffit simplement d’utiliser des chiffres

1. gras
2. italique

Pour créer des en-têtes de section de différentes tailles, il suffit de mettre un certain nombre de symboles #:

# Titre
## Section principale
### Sous-section
#### Sous-sous-section

Code

Les morceaux de codes ressemblent à

```{r}
sample(10)
```

Il y a une variété d’options pour affecter la façon dont les morceaux de code sont traités:

  • echo = FALSE pour éviter que le code soit affiché
  • results =“hide” pour éviter d’imprimer des résultats
  • eval = FALSE pour afficher le code mais ne pas l’évaluer
  • warning = FALSE et message = FALSE pour masquer les avertissements ou messages produits.
  • fig.height et fig.width pour contrôler la taille des figures produites (en pouces).