R
R
est un langage de programmation destiné aux statistiques et à la science des données. R
a plusieurs avantages:
Ce logiciel peut être téléchargé sur le site du CRAN (Comprehensive R Archive Network) à l’adresse suivante https://cran.r-project.org/. Il existe de nombreuses sources d’informations disponibles en ligne.
RStudio
RStudio
est une sur-couche de R (également libre et gratuit) rendant son utilisation plus conviviale. Il peut-être téléchargée sur https://rstudio.com (après avoir téléchargé le logiciel R).
Lorsque vous ouvrez RStudio
pour la première fois, l’interface est divisée par défaut en 3 fenêtres:
R
qui sert à exécuter le code (à gauche)Une fois que vous ouvrez des fichiers, tels que des scripts R
, l’éditeur s’ouvre au-dessus de la console. Il permet d’écrire du code et de le sauver.
Rmarkdown
Rmarkdown
est un langage à balise qui permet des générer des rapports en mélangeant du texte, du code R et les résultats produits par ce code. En plus de produire des rapports agréables à lire (le code et ses résultats ne sont pas séparés des commentaires qui leur sont associés), son principal avantage est qu’il produit des rapports qui sont dynamiques et qui rendent les travaux reproductibles.
C’est un simple fichier texte dont l’extension est .Rmd
. Voici un exemple très simple de document Rmarkdown
:
---
title: "Test R Markdown"
author: "Ana Karina FERMIN"
date: "06/11/2020"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
## Codes R
Les blocs de code sont exécutés et leur résultat s'affiche juste après. Par exemple,
```{r}
summary(cars)
```
```{r}
mean(cars$speed)
```
## Graphes
```{r, out.width = "60%",fig.align='center'}
plot(cars$speed, cars$dist)
```
Les documents peuvent être ‘compilés’ sous différents formats (HTML, PDF, Word). Voici le rendu du document précédent au format HTML :
tidyverse
Le terme tidyverse
est une contraction de tidy (traduit comme “bien rangé”) et de universe. Le tidyverse
est un ensemble d’extensions pour R conçues pour fonctionner ensemble. Elle facilitent un très grand nombre d’opérations courantes dans R. Plusieurs packages constituent le coeur de tidyverse
:
library(tidyverse)
Vous avez à disposition des documents synthétiques sur les grammaires des packages purrr, dplyr et tidyr, et ggplot2.
R
et Rstudio
Lorsque RStudio
est lancé, l’utilisateur se trouve face à la console. C’est une fenêtre de texte qui commence par le signe >, signifiant que le logiciel attend les ordres. On peut commencer par taper quelques opérations simples:
2+3
## [1] 5
sample(10)
## [1] 3 4 1 6 8 2 10 5 9 7
rnorm(10)
## [1] 0.9359318 0.2577945 0.7059583 -0.1771677 -2.5169194 -1.0573928
## [7] -1.0944042 0.6270122 0.8298302 -0.9538768
rbinom(10,1,0.7)
## [1] 0 1 1 1 0 1 1 1 1 0
En utilisant les flèches ↑ et ↓, on peut rappeler les dernières commandes exécutées.
Pour chercher de l’aide sur une fonction spécifique
?nom_fonction
# ou
help(nom_fonction)
Cela chargera une page d’aide dans l’onglet Help
(en bas à droite).
R
est un logiciel très vivant car de nouvelles fonctionnalités lui sont sans cesse ajoutées au travers de petits ensemble de fonction regoupées dans un package. Ainsi chaque personne est libre de contribuer au développement du logiciel. Ces package sont regroupés sur le CRAN et sont accessibles à tous.
Pour installer un package,
Package
Install
Package
Install
Le package sera installé une bonne fois pour toute (installé sur le disque dur de votre ordinateur).Une fois le package installé, il faudra, à chaque fois que vous ouvrez R
, le “charger” avant de pouvoir utiliser les fonctions qu’il propose. Ceci se fait avec la fonction library
. Par exemple,
library(rmarkdown)
Vous pouvez taper des commandes directement dans la console, mais elles seront oubliées lorsque vous fermerez la session. Deux solutions:
File –> New File –> R Script
. Vous pouvez:R
)Rmarkdown
(cf paragraphe suivant).Pour créer un document Rmarkdown , cliquer sur File –> New File –> R Markdown
et une boîte de dialogue s’ouvre:
Pour générer le fichier associé, cliquer sur Knit
et choisissez le format que vous voulez. Un fichier avec l’extension du format donné portant le même nom que fichier.Rmd est alors créé dans le même directory et en même temps le rapport généré s’ouvre dans le viewer de RStudio
.
La personnalisation du document généré se fait en modifiant des options dans le préambule du document. RStudio propose néanmoins une petite interface graphique permettant de changer ces options plus facilement. Pour cela, cliquez sur l’icône en forme d’engrenage à droite du bouton Knit et choisissez Output Options
.
Pour écrire
- en gras: **gras**,
- en italique: _italics_.
Pour créer une liste numérotée, il suffit simplement d’utiliser des chiffres
1. gras
2. italique
Pour créer des en-têtes de section de différentes tailles, il suffit de mettre un certain nombre de symboles #:
# Titre
## Section principale
### Sous-section
#### Sous-sous-section
Les morceaux de codes ressemblent à
```{r}
sample(10)
```
Il y a une variété d’options pour affecter la façon dont les morceaux de code sont traités: