1 Préambule

Ce livre contient l’ensemble du matériel (contenus, exemples, exercices…) nécessaire à la réalisation des travaux pratiques et TEA de biométrie 3. L’objectif principal de ces travaux pratiques est de vous permettre de mettre en œuvre, dans RStudio, les méthodes statistiques découvertes en cours magistral et en TD de biométrie 2 (au semestre précédent) et en biométrie 3 depuis début janvier.

Je considère qu’à ce stade, vous devez être à l’aise dans RStudio pour effectuer les tâches suivantes :

  1. Importer des jeux de données dans RStudio.
  2. Manipuler des tableaux de données avec tidyr (Wickham & Girlich, 2022) pour les mettre dans un format permettant les analyses statistiques et les représentations graphiques.
  3. Faire des graphiques exploratoires avec ggplot2 (Wickham, Chang, et al., 2021) pour visualiser des données.
  4. Filtrer des lignes, sélectionner des colonnes, trier, créer de nouvelles variables et calculer des résumés des données avec les fonctions filter(), select(), arrange(), mutate(), summarise() et group_by() du package dplyr (Wickham, François, et al., 2022).
  5. Utiliser le pipe %>% afin d’enchaîner plusieurs commandes.
  6. Créer des scripts clairs et parlants, contenant des commandes et des commentaires utiles.
  7. Spécifier/modifier votre répertoire de travail.
  8. Installer des packages additionnels.

Si vous pensez avoir besoin de rappels sur ces notions, je vous encourage vivement à consulter le livre en ligne dédié aux travaux pratiques de Biométrie 2 pour vous rafraîchir la mémoire.

L’organisation des TP et TEA de biométrie 3 sera la suivante :

  • Séance 1 : 1h30 de TP suivie d’une séance de 1h30 de TEA. Rappels concernant les statistiques descriptives et les visualisations graphiques utiles pour démêler la complexité de certains jeux de données. Comparaisons (paramétriques et non paramétriques) de la moyenne de 2 populations.
  • Séance 2 : 1h30 de TP suivie d’une séance de 1h30 de TEA. Comparaisons (paramétriques et non paramétriques) la moyenne de plus de 2 populations : analyse de variance, hypothèses et conditions d’application.
  • Séance 3 : 1h30 de TP suivie d’une séance de 1h30 de TEA. Étude de la liaison entre 2 variables. Corrélation (paramétrique et non paramétrique) et régression linéaire. Tests d’hypothèses, estimation et conditions d’application.
  • Séance 4 : 1h30 de TP. Exercices d’application et corrections en guise de préparation pour l’examen.

References

Wickham H, Chang W, Henry L, Pedersen TL, Takahashi K, Wilke C, … Dunnington D. (2021). Ggplot2: Create elegant data visualisations using the grammar of graphics. Retrieved from https://CRAN.R-project.org/package=ggplot2

Wickham H, François R, Henry L, & Müller K. (2022). Dplyr: A grammar of data manipulation. Retrieved from https://CRAN.R-project.org/package=dplyr

Wickham H, & Girlich M. (2022). Tidyr: Tidy messy data. Retrieved from https://CRAN.R-project.org/package=tidyr