library(tidyverse)

Exercice

Nous considérons les données salaires.tex (déjà étudié dans le TP1 (partie 1)).

  1. Définir la population étudiée. Indiquer quelles sont les variables quantitatives et qualitatives.

  2. Relever : le salaire actuel en dessous duquel se situent 50% des employés de l’échantillon et le salaire actuel au-dessus duquel se situent 25% des employés de l’échantillon.

##      salary          salbegin        jobtime         prevexp      
##  Min.   : 15750   Min.   : 9000   Min.   :63.00   Min.   :  0.00  
##  1st Qu.: 24000   1st Qu.:12488   1st Qu.:72.00   1st Qu.: 19.25  
##  Median : 28875   Median :15000   Median :81.00   Median : 55.00  
##  Mean   : 34420   Mean   :17016   Mean   :81.11   Mean   : 95.86  
##  3rd Qu.: 36938   3rd Qu.:17490   3rd Qu.:90.00   3rd Qu.:138.75  
##  Max.   :135000   Max.   :79980   Max.   :98.00   Max.   :476.00  
##       educ       minority  sex    
##  Min.   : 8.00   Non:370   H:258  
##  1st Qu.:12.00   Oui:104   F:216  
##  Median :12.00                    
##  Mean   :13.49                    
##  3rd Qu.:15.00                    
##  Max.   :21.00
  1. Commenter les grafiques suivantes :

  1. Peut-on conclure, au risque d’erreur \(\alpha=5\%,\) qu’il existe une liaison entre les variables salary et salbegin ? (n’oubliez pas de donner les hypthèses nulle et alternative du test)
cor(salary,salbegin)
## [1] 0.8801175
cor.test(salary,salbegin,method="pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  salary and salbegin
## t = 40.276, df = 472, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.8580696 0.8989267
## sample estimates:
##       cor 
## 0.8801175
  1. On étudie simultanément le sexe et l’appartenance à une minorité. On veut tester l’existence d’une liaison entre le sexe et l’appartenance à une minorité chez les salariés de l’entreprise.
  1. Préciser les hypothèse nulle et alternative du test.

  2. Donner les conditions d’application du test. Sont-elles vérifiées ?

  3. Que pouvez-vous conclure au risque 5% ?

#Tableau de contingence 
nij=table(Salaire$minority,Salaire$sex)
nij
##      
##         H   F
##   Non 194 176
##   Oui  64  40
#Commandes directes avec la fonction chisq.test
test=chisq.test(nij)
test$observed
##      
##         H   F
##   Non 194 176
##   Oui  64  40
test$expected
##      
##               H         F
##   Non 201.39241 168.60759
##   Oui  56.60759  47.39241
test
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  nij
## X-squared = 2.3592, df = 1, p-value = 0.1245