Une breve introduction à R

Le logiciel R est un langage très puissant orienté vers l’analyse statistique et traitement des données. Il est développé depuis une vingtaine d’années par un groupe de volontaires de différents pays. C’est un logiciel libre, disponible gratuitement pour Windows, Mac OS X et Linux. Il est à noter que le développement autour de R a été particulièrement actif ces dernières années. R est très utilisé dans le monde academique et dans l’industrie.

R regorge des developpeurs de talent, des packages assez interessants ont vu le jour recemment. Toute personne interessée en R peut trouver la documentation en ligne.

https://datahowler.wordpress.com/2016/09/10/no-more-excuses-r-is-better-than-spss-for-psychology-undergrads-and-students-agree/

Installation du logiciel R

Avant de commencer ce TP, il est nécessaire de s’assurer que le logiciel R est installé sur votre machine. Le logiciel R est gratuit et téléchargeable sur internet à l’adresse http://cran.r-project.org.

  • Pour une installation sous Windows, on se rendra sur cette page : http://cran.r-project.org/bin/windows/ base/ et l’on suivra le premier lien pour télécharger le programme d’installation. Une fois le programme d’installation lancé, il suffira d’installer R avec les options par défaut.

  • Pour Mac OS X, les fichiers d’installation sont disponibles à http://cran.r-project.org/bin/macosx/.

Une fois R correctement installé,vous pouvez également télécharger le logiciel RStudio (une interface de développement pour R) à l’adresse suivante : rendez-vous sur http://www.rstudio.com/products/rstudio/download/

  • Création d’un script R : Le logiciel R utilise des lignes de commandes. Il faut donc taper les commandes dans la console pour les exécuter. Plutôt que de saisir les commandes directement dans la console, on vous conseille de les enregistrer directement dans un script de commandes R, ce qui permet de reproduire les analyses ultérieurement. A chaque séance de TP créer un fichier scrip R pour enregistrer les commandes et codes.

  • Aide en ligne : R possède un système d’aide en ligne, incluant un moteur de recherche et un index des commandes associées. Pour accéder à l’aide pour n’importe quelle fonction, on utilise la commande . Le logiciel R ouvre une fenêtre avec les informations relatives à la fonction demandée.

  • Packages (commande library) : R dispose d’un certain nombre de packages de base qui sont installés lors de l’installation de R. Il est possible d’installer des packages additionnels. Le chargement d’un package s’effectue à l’aide de la commande , en indiquant le nom du package.

  • Doc sur initiation à R : A vous de regarder la doc ! Par exemple vous pouvez aller sur la site

http://www.math.univ-toulouse.fr/~besse/Wikistat/pdf/st-tutor2-R-init.pdf

Exercice 1 (Découvrir R)

Visualiser sur la console de R les commandes suivaNtes. Vous remarquerez que R est anglo-saxon. Les nombres sont donc saisies à l’anglaise, c’est-à-dire en utilisant le point ( . ) comme séparateur pour les décimales.

Assignation

a <- 2 #(ou a=2)
a
## [1] 2

Operations algébraiques

2*4
## [1] 8
2+4
## [1] 6
sqrt(4)
## [1] 2
2^4
## [1] 16
2*4 + 2^2 + sqrt(4) 
## [1] 14

Création d’un vecteur

#La fonction c() combine des valeurs dans un  vecteur
x1 <- c(10,16,12,11,14);x1
## [1] 10 16 12 11 14
#un autre vecteur
x2 <- c(6,8,10,11,12.5); x2
## [1]  6.0  8.0 10.0 11.0 12.5
#Combitation de deux vecteurs
x3 <- c(x1,x2);x3
##  [1] 10.0 16.0 12.0 11.0 14.0  6.0  8.0 10.0 11.0 12.5
#Creation d'autres vecteurs :
#Suite de 3 nombres consécutifs (1 à 3)
1:3
## [1] 1 2 3
#A vous de jouer !  
#Regarder l'aide. Taper sur la console help(rep) puis help(seq)
rep(1,times=5)
## [1] 1 1 1 1 1
rep(1:3,times=5)
##  [1] 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3
seq(from=1,to=5,by=0.5)
## [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0

Generation aléatoire d’un vecteur

Générer un vecteur de taille 10 selon une loi normale de moyenne 0 et écar-type 1

x <- rnorm(10,mean=0,sd=1) ; x
##  [1]  1.3667267 -1.2377103  2.1182055 -1.8510712 -1.1716460 -1.8519068
##  [7] -0.8855641  0.7511790  0.9379153 -0.9039511
#A vous de jouer ! Taper help(rnorm) sur la console de R.
#Quelques calcules simples : moyenne et ecart-type de x
mean(x); sd(x)
## [1] -0.2727823
## [1] 1.430487

Histogramme

Générer un vecteur de taille 1000 selon une loi normale de moyenne 0 et écar-type 1. Visualiser l’histogramme.

x <- rnorm(1000,0,1)
hist(x, probability=T, col='light blue')

x <- rnorm(1000,0,1)
hist(x, probability=T, col='light blue', main='Histogramme de x', ylab="Densité")