Merge branch 'master' of github.com:BioDataScience-Course/BioDataScience1

phgrosjean · phgrosjean · commit 24645b316501 · 2023-09-14T16:15:59.000+02:00
diff --git a/inst/tutorials/A02La_base/A02La_base.Rmd.inactive b/inst/tutorials/A02La_base/A02La_base.Rmd.inactive
@@ -314,7 +314,7 @@ mean(v4)
 ```
 
 ```{r vec2-check}
-grade_code("C'est cela : les fonctions génériques s'utilisent comme les autres, mais faites bien attention aux différentes formes possibles (que l'on appelle les **méthodes** de la fonction) !.")
+grade_code("C'est cela : les fonctions génériques s'utilisent comme les autres, mais faites bien attention aux différentes formes possibles (que l'on appelle les **méthodes** de la fonction) !")
 ```
 
 Certaines fonctions servent à **résumer** un ensemble de données, c'est-à-dire qu'elles les représentent avec une seule ou un petit nombre de valeurs. Ainsi, quelle que soit la taille du vecteur `v4`, sa moyenne est toujours un nombre unique. Ici, nous avons obtenu `NA`. Nous savons pourquoi. Les valeurs manquantes sont **contaminantes** dans les calculs. Il en suffit d'une seule pour que l'ensemble du résultat soit `NA`. Naturellement dans ce cas, c'est dommage, car la moyenne pourrait être *estimée* sur base des trois autres valeurs connues. L'argument `na.rm` permet de le faire... mais comment le savoir ? En lisant **la page d'aide de la fonction**. Pour cela, utilisez l'instruction `?` suivi du nom de la fonction. Dans RStudio, la page d'aide apparaît dans l'onglet **Help** (copie d'écran ci-dessous).
@@ -449,7 +449,7 @@ log(x) %>.%
 grade_code("C'est exactement cela. Le chaînage des opérations rend le code bien plus lisible.")
 ```
 
-Vous utiliserez aussi l'opérateur de pipe de R de base `|>`. Il s'utilise de façon similaire, sauf que le mebre de gauche est injecté comme premier argument dans la fonction à droite, et il ne faut pas (et même, on ne peut pas) indiquer où le mettre à l'aide du point `.`. Voici, à titre d'illustration, trois fois la même instruction, écrite en imbriquant les fonction, puis avec `%>.%`, et enfin, avec `|>`.
+On retrouve plusieurs opérateur de pipe dans R. Par exemple, l'opérateur de pipe de R de base est `|>`. Il s'utilise de façon similaire, sauf que le membre de gauche est injecté comme premier argument dans la fonction à droite, et il ne faut pas (et même, on ne peut pas) indiquer où le mettre à l'aide du point `.`. Voici, à titre d'illustration, trois fois la même instruction, écrite en imbriquant les fonction, puis avec `%>.%`, et enfin, avec `|>`.
 
 ```{r, echo=TRUE}
 x <- 1:5
diff --git a/inst/tutorials/A02Lb_progression/A02Lb_progression.Rmd.inactive b/inst/tutorials/A02Lb_progression/A02Lb_progression.Rmd.inactive
@@ -4,7 +4,7 @@ author : "Guyliann Engels & Philippe Grosjean"
 description: "**SDD I Module 2** Progression dans R via l'étude d'un cas concret."
 tutorial:
   id: "A02Lb_progression"
-  version: 2.3.1/10
+  version: 2.4.0/10
 output:
   learnr::tutorial:
     progressive: true
@@ -49,18 +49,22 @@ En partant d'un tableau de données relatif à de la biométrie humaine contenan
 # Chargement de SciViews::R
 SciViews::R(lang = "fr")
 # Importation du jeu de données
-(biometry <- read("biometry", package = "BioDataScience"))
+biometry <- read("biometry", package = "BioDataScience")
+# Affichage des 10 premières lignes du tableau
+tabularise(biometry, max.rows = 10)
 ```
 
 **Notez ceci :**
 
 -   Les encadrés gris dénotent des instructions entrées dans R. Si ce dernier renvoie des résultats, ils sont présentés dans des encadrés blancs juste en dessous.
 
--   Toujours commencer par l'instruction `SciViews::R()` pour installer les différents outils (rassemblés dans des extensions du programme, appelées "packages" R) dont nous aurons besoin. Cette instruction peut comprendre des arguments comme `lang = "fr"`. Cet argument va avoir pour effet de définir le français comme langue par défaut (là où cela est supporté, mais malheureusement pas dans l'interface du logiciel ou les messages d'erreur).
+-   Toujours commencer par l'instruction `SciViews::R()` pour installer les différents outils (rassemblés dans des extensions du programme, appelées "packages" R) dont nous aurons besoin. Cette instruction peut comprendre des arguments comme `lang = "fr"`. Cet argument va avoir pour effet de définir le français comme langue par défaut (là où cela est supporté).
+
+-   L'anglais est la langue la plus employée en science des données. Les jeux de données employés sont encodés en anglais. En définissant le français comme langue par défaut, si une traduction est disponible, certains graphiques et tableaux que l'on va réaliser auront automatique des labels en français.
 
 -   Le jeu de données est disponible dans un package R : `BioDataScience`, spécialement préparé pour ce cours.
 
--   L'anglais est la langue la plus employée en science des données. Les jeux de données employés sont encodés en anglais. En définissant le français comme langue par défaut, si une traduction est disponible, les graphiques que l'on va réaliser auront automatique des labels en français.
+-   La fonction `read()` permet de lire les données issues du package `BioDataScience`. La fonction `tabularise()` a pour objectif de formater correctement un tableau (et bien plus encore. Vous le découvrirez tout à long de ce cours).
 
 Le point d'interrogation devant notre jeu de données renvoie vers une page d'aide, tout comme pour les fonctions.
 
@@ -80,12 +84,10 @@ bio <- sselect(biometry, -day_birth, -wrist, -year_measure)
 
 Nous réalisons cette sélection avec la fonction `sselect()` en éliminant des colonnes du tableau que nous n'utiliserons pas (les variables `day_birth`, `wrist` et `year_measure`). Le résultat de cette fonction est assigné à `bio` grâce à l'opérateur d'assignation `<-` déjà vu dans le tutoriel précédent.
 
-La fonction `kable()` du package {knitr} peut être appelée directement sans charger le package à l'aide de l'instruction `knitr::kable()`. Elle permet de formater correctement un tableau en Markdown. Utilisons-là maintenant pour présenter les huit premières lignes de notre jeu de données grâce à la fonction `head()`.
+Utilisons la fonction `tabularise()` du package {tabularise} maintenant pour présenter les huit premières lignes de notre jeu de données.
 
 ```{r, echo=TRUE}
-bio %>.%
-  head(., n = 8) %>.% # Garde les huit premières lignes
-  knitr::kable(., align = "c")
+tabularise(bio, max.rows = 8)
 ```
 
 **Notez ceci :**
@@ -97,8 +99,7 @@ Considérons maintenant uniquement les femmes. On peut filtrer les lignes d'un t
 ```{r, echo=TRUE}
 bio %>.%
   sfilter(., gender == "W") %>.%
-  head(., n = 8) %>.% # Garde les huit premières lignes
-  knitr::kable(., align = "c")
+  tabularise(., max.rows = 8)
 ```
 
 Continuons à manipuler notre tableau en sélectionnant des colonnes et en filtrant les lignes en une seule opération. Pour sélectionner les femmes `gender == "W"` et retirer la colonne `age`, nous utiliserons :
@@ -107,8 +108,7 @@ Continuons à manipuler notre tableau en sélectionnant des colonnes et en filtr
 bio %>.%
   sfilter(., gender == "W") %>.% # Sélectionne les femmes
   sselect(., -age) %>.% # Retire la colonne âge
-  head(., n = 8) %>.% # Garde les huit premières lignes
-  knitr::kable(., align = "c")
+  tabularise(., max.rows = 8)
 ```
 
 Maintenant que nous avons vu comment lire, remanier et présenter des tableaux de données dans R (nous reviendrons sur ces notions plus tard), nous pouvons explorer ses potentialités pour réaliser des graphiques à la section suivante...
diff --git a/inst/tutorials/A02Lc_scatterplot/A02Lc_scatterplot.Rmd.inactive b/inst/tutorials/A02Lc_scatterplot/A02Lc_scatterplot.Rmd.inactive
@@ -4,7 +4,7 @@ author : "Guyliann Engels & Philippe Grosjean"
 description: "**SDD I Module 2** Réalisation de graphiques en nuage de points."
 tutorial:
   id: "A02Lc_scatterplot"
-  version: 2.3.2/6
+  version: 2.4.0/6
 output:
   learnr::tutorial:
     progressive: true
@@ -241,29 +241,29 @@ Intéressez-vous maintenant à la masse (`weight`) des individus en fonction de
 ```{r 2factor_graph_intro}
 urchin <- sdrop_na(urchin, sex)
 chart(data = urchin, weight ~ buoyant_weight %col=% origin %shape=% sex) +
-  geom_point(na.rm = TRUE)
+  geom_point()
 ```
 
-Réalisez un nuage de points montrant la masse en ordonnée et la masse immergée en abscisse. Utilisez la couleur afin de différencier l'origine des individus et différentes formes afin de différencier le sexe des individus. Précisez à nouveau que vous souhaitez éliminer les valeurs manquantes de manière tacite.
+Réalisez un nuage de points montrant la masse en ordonnée et la masse immergée en abscisse. Utilisez la couleur afin de différencier l'origine des individus et différentes formes afin de différencier le sexe des individus.
 
 Vous pouvez observer qu'une première ligne de code vous est fournie afin de retirer les lignes de tableau ne contenant pas l'information sur le sexe des individus. Vous apprendrez dans les prochains cours à manipuler vos jeux de données pour réaliser ce genre de chose par vous-mêmes.
 
 ```{r 2factor_graph_h3, exercise=TRUE}
 urchin <- sdrop_na(urchin, sex)
 chart(data = ___, ___ ~ ___ %col=% ___ ___ ___) +
-  geom_point(___)
+  geom_point()
 ```
 
 ```{r 2factor_graph_h3-hint-1}
 urchin <- sdrop_na(urchin, sex)
 chart(data = ___, ___ ~ ___ %col=% ___ %shape=% ___) +
-  geom_point(___)
+  geom_point()
 ```
 
 ```{r 2factor_graph_h3-hint-2}
 urchin <- sdrop_na(urchin, sex)
 chart(data = DF, YNUM ~ XNUM %col=% FACTOR1 %shape=% FACTOR2) +
-  geom_point(___)
+  geom_point()
 
 #### Attention : solution dans le 'hint' suivant! ####
 ```
@@ -272,7 +272,7 @@ chart(data = DF, YNUM ~ XNUM %col=% FACTOR1 %shape=% FACTOR2) +
 ## Solution ##
 urchin <- sdrop_na(urchin, sex)
 chart(data = urchin, weight ~ buoyant_weight %col=% origin %shape=% sex) +
-  geom_point(na.rm = TRUE)
+  geom_point()
 ```
 
 ```{r 2factor_graph_h3-check}
@@ -285,41 +285,41 @@ Intéressez-vous maintenant à la hauteur (`height`) en fonction de la masse (`w
 
 ```{r}
 a <- chart(data = urchin, height ~ weight %col=% origin) +
-  geom_point(na.rm = TRUE)
+  geom_point()
 b <- chart(data = urchin, log(height) ~ log(weight) %col=% origin) +
-  geom_point(na.rm = TRUE)
+  geom_point()
 
 combine_charts(list(a, b), labels = NULL, common.legend = TRUE, legend = "right")
 ```
 
-Réalisez un nuage de points montrant le **logarithme de la hauteur** en ordonnée et le **logarithme de la masse** en abscisse. Utilisez la couleur afin de différencier l'origine des individus et précisez à nouveau que vous souhaitez bien éliminer les valeurs manquantes de manière tacite.
+Réalisez un nuage de points montrant le **logarithme de la hauteur** en ordonnée et le **logarithme de la masse** en abscisse. Utilisez la couleur afin de différencier l'origine des individus.
 
 ```{r log_log_h4, exercise = TRUE}
 chart(data = ___, ___ ~ ___ ___ ___) +
-  geom_point(___)
+  geom_point()
 ```
 
 ```{r log_log_h4-hint-1}
 chart(data = DF, ___ ~ ___ %col=% ___) +
-  geom_point(___)
+  geom_point()
 ```
 
 ```{r log_log_h4-hint-2}
 chart(data = urchin, YNUM ~ XNUM %col=% FACTOR) +
-  geom_point(___)
+  geom_point()
 ```
 
 ```{r log_log_h4-hint-3}
 chart(data = urchin, log(YNUM) ~ log(XNUM) %col=% FACTOR) +
-  geom_point(___)
+  geom_point()
 
 #### Attention : solution dans le 'hint' suivant! ####
 ```
 
 ```{r log_log_h4-solution}
 ## Solution ##
 chart(data = urchin, log(height) ~ log(weight) %col=% origin) +
-  geom_point(na.rm = TRUE)
+  geom_point()
 ```
 
 ```{r log_log_h4-check}