Skip to content

Commit 24645b3

Browse files
committed
Merge branch 'master' of github.com:BioDataScience-Course/BioDataScience1
2 parents 6926353 + 9d84dbf commit 24645b3

File tree

3 files changed

+29
-29
lines changed

3 files changed

+29
-29
lines changed

inst/tutorials/A02La_base/A02La_base.Rmd.inactive

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -314,7 +314,7 @@ mean(v4)
314314
```
315315

316316
```{r vec2-check}
317-
grade_code("C'est cela : les fonctions génériques s'utilisent comme les autres, mais faites bien attention aux différentes formes possibles (que l'on appelle les **méthodes** de la fonction) !.")
317+
grade_code("C'est cela : les fonctions génériques s'utilisent comme les autres, mais faites bien attention aux différentes formes possibles (que l'on appelle les **méthodes** de la fonction) !")
318318
```
319319

320320
Certaines fonctions servent à **résumer** un ensemble de données, c'est-à-dire qu'elles les représentent avec une seule ou un petit nombre de valeurs. Ainsi, quelle que soit la taille du vecteur `v4`, sa moyenne est toujours un nombre unique. Ici, nous avons obtenu `NA`. Nous savons pourquoi. Les valeurs manquantes sont **contaminantes** dans les calculs. Il en suffit d'une seule pour que l'ensemble du résultat soit `NA`. Naturellement dans ce cas, c'est dommage, car la moyenne pourrait être *estimée* sur base des trois autres valeurs connues. L'argument `na.rm` permet de le faire... mais comment le savoir ? En lisant **la page d'aide de la fonction**. Pour cela, utilisez l'instruction `?` suivi du nom de la fonction. Dans RStudio, la page d'aide apparaît dans l'onglet **Help** (copie d'écran ci-dessous).
@@ -449,7 +449,7 @@ log(x) %>.%
449449
grade_code("C'est exactement cela. Le chaînage des opérations rend le code bien plus lisible.")
450450
```
451451

452-
Vous utiliserez aussi l'opérateur de pipe de R de base `|>`. Il s'utilise de façon similaire, sauf que le mebre de gauche est injecté comme premier argument dans la fonction à droite, et il ne faut pas (et même, on ne peut pas) indiquer où le mettre à l'aide du point `.`. Voici, à titre d'illustration, trois fois la même instruction, écrite en imbriquant les fonction, puis avec `%>.%`, et enfin, avec `|>`.
452+
On retrouve plusieurs opérateur de pipe dans R. Par exemple, l'opérateur de pipe de R de base est `|>`. Il s'utilise de façon similaire, sauf que le membre de gauche est injecté comme premier argument dans la fonction à droite, et il ne faut pas (et même, on ne peut pas) indiquer où le mettre à l'aide du point `.`. Voici, à titre d'illustration, trois fois la même instruction, écrite en imbriquant les fonction, puis avec `%>.%`, et enfin, avec `|>`.
453453

454454
```{r, echo=TRUE}
455455
x <- 1:5

inst/tutorials/A02Lb_progression/A02Lb_progression.Rmd.inactive

Lines changed: 12 additions & 12 deletions
Original file line numberDiff line numberDiff line change
@@ -4,7 +4,7 @@ author : "Guyliann Engels & Philippe Grosjean"
44
description: "**SDD I Module 2** Progression dans R via l'étude d'un cas concret."
55
tutorial:
66
id: "A02Lb_progression"
7-
version: 2.3.1/10
7+
version: 2.4.0/10
88
output:
99
learnr::tutorial:
1010
progressive: true
@@ -49,18 +49,22 @@ En partant d'un tableau de données relatif à de la biométrie humaine contenan
4949
# Chargement de SciViews::R
5050
SciViews::R(lang = "fr")
5151
# Importation du jeu de données
52-
(biometry <- read("biometry", package = "BioDataScience"))
52+
biometry <- read("biometry", package = "BioDataScience")
53+
# Affichage des 10 premières lignes du tableau
54+
tabularise(biometry, max.rows = 10)
5355
```
5456

5557
**Notez ceci :**
5658

5759
- Les encadrés gris dénotent des instructions entrées dans R. Si ce dernier renvoie des résultats, ils sont présentés dans des encadrés blancs juste en dessous.
5860

59-
- Toujours commencer par l'instruction `SciViews::R()` pour installer les différents outils (rassemblés dans des extensions du programme, appelées "packages" R) dont nous aurons besoin. Cette instruction peut comprendre des arguments comme `lang = "fr"`. Cet argument va avoir pour effet de définir le français comme langue par défaut (là où cela est supporté, mais malheureusement pas dans l'interface du logiciel ou les messages d'erreur).
61+
- Toujours commencer par l'instruction `SciViews::R()` pour installer les différents outils (rassemblés dans des extensions du programme, appelées "packages" R) dont nous aurons besoin. Cette instruction peut comprendre des arguments comme `lang = "fr"`. Cet argument va avoir pour effet de définir le français comme langue par défaut (là où cela est supporté).
62+
63+
- L'anglais est la langue la plus employée en science des données. Les jeux de données employés sont encodés en anglais. En définissant le français comme langue par défaut, si une traduction est disponible, certains graphiques et tableaux que l'on va réaliser auront automatique des labels en français.
6064

6165
- Le jeu de données est disponible dans un package R : `BioDataScience`, spécialement préparé pour ce cours.
6266

63-
- L'anglais est la langue la plus employée en science des données. Les jeux de données employés sont encodés en anglais. En définissant le français comme langue par défaut, si une traduction est disponible, les graphiques que l'on va réaliser auront automatique des labels en français.
67+
- La fonction `read()` permet de lire les données issues du package `BioDataScience`. La fonction `tabularise()` a pour objectif de formater correctement un tableau (et bien plus encore. Vous le découvrirez tout à long de ce cours).
6468

6569
Le point d'interrogation devant notre jeu de données renvoie vers une page d'aide, tout comme pour les fonctions.
6670

@@ -80,12 +84,10 @@ bio <- sselect(biometry, -day_birth, -wrist, -year_measure)
8084

8185
Nous réalisons cette sélection avec la fonction `sselect()` en éliminant des colonnes du tableau que nous n'utiliserons pas (les variables `day_birth`, `wrist` et `year_measure`). Le résultat de cette fonction est assigné à `bio` grâce à l'opérateur d'assignation `<-` déjà vu dans le tutoriel précédent.
8286

83-
La fonction `kable()` du package {knitr} peut être appelée directement sans charger le package à l'aide de l'instruction `knitr::kable()`. Elle permet de formater correctement un tableau en Markdown. Utilisons-là maintenant pour présenter les huit premières lignes de notre jeu de données grâce à la fonction `head()`.
87+
Utilisons la fonction `tabularise()` du package {tabularise} maintenant pour présenter les huit premières lignes de notre jeu de données.
8488

8589
```{r, echo=TRUE}
86-
bio %>.%
87-
head(., n = 8) %>.% # Garde les huit premières lignes
88-
knitr::kable(., align = "c")
90+
tabularise(bio, max.rows = 8)
8991
```
9092

9193
**Notez ceci :**
@@ -97,8 +99,7 @@ Considérons maintenant uniquement les femmes. On peut filtrer les lignes d'un t
9799
```{r, echo=TRUE}
98100
bio %>.%
99101
sfilter(., gender == "W") %>.%
100-
head(., n = 8) %>.% # Garde les huit premières lignes
101-
knitr::kable(., align = "c")
102+
tabularise(., max.rows = 8)
102103
```
103104

104105
Continuons à manipuler notre tableau en sélectionnant des colonnes et en filtrant les lignes en une seule opération. Pour sélectionner les femmes `gender == "W"` et retirer la colonne `age`, nous utiliserons :
@@ -107,8 +108,7 @@ Continuons à manipuler notre tableau en sélectionnant des colonnes et en filtr
107108
bio %>.%
108109
sfilter(., gender == "W") %>.% # Sélectionne les femmes
109110
sselect(., -age) %>.% # Retire la colonne âge
110-
head(., n = 8) %>.% # Garde les huit premières lignes
111-
knitr::kable(., align = "c")
111+
tabularise(., max.rows = 8)
112112
```
113113

114114
Maintenant que nous avons vu comment lire, remanier et présenter des tableaux de données dans R (nous reviendrons sur ces notions plus tard), nous pouvons explorer ses potentialités pour réaliser des graphiques à la section suivante...

inst/tutorials/A02Lc_scatterplot/A02Lc_scatterplot.Rmd.inactive

Lines changed: 15 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -4,7 +4,7 @@ author : "Guyliann Engels & Philippe Grosjean"
44
description: "**SDD I Module 2** Réalisation de graphiques en nuage de points."
55
tutorial:
66
id: "A02Lc_scatterplot"
7-
version: 2.3.2/6
7+
version: 2.4.0/6
88
output:
99
learnr::tutorial:
1010
progressive: true
@@ -241,29 +241,29 @@ Intéressez-vous maintenant à la masse (`weight`) des individus en fonction de
241241
```{r 2factor_graph_intro}
242242
urchin <- sdrop_na(urchin, sex)
243243
chart(data = urchin, weight ~ buoyant_weight %col=% origin %shape=% sex) +
244-
geom_point(na.rm = TRUE)
244+
geom_point()
245245
```
246246

247-
Réalisez un nuage de points montrant la masse en ordonnée et la masse immergée en abscisse. Utilisez la couleur afin de différencier l'origine des individus et différentes formes afin de différencier le sexe des individus. Précisez à nouveau que vous souhaitez éliminer les valeurs manquantes de manière tacite.
247+
Réalisez un nuage de points montrant la masse en ordonnée et la masse immergée en abscisse. Utilisez la couleur afin de différencier l'origine des individus et différentes formes afin de différencier le sexe des individus.
248248

249249
Vous pouvez observer qu'une première ligne de code vous est fournie afin de retirer les lignes de tableau ne contenant pas l'information sur le sexe des individus. Vous apprendrez dans les prochains cours à manipuler vos jeux de données pour réaliser ce genre de chose par vous-mêmes.
250250

251251
```{r 2factor_graph_h3, exercise=TRUE}
252252
urchin <- sdrop_na(urchin, sex)
253253
chart(data = ___, ___ ~ ___ %col=% ___ ___ ___) +
254-
geom_point(___)
254+
geom_point()
255255
```
256256

257257
```{r 2factor_graph_h3-hint-1}
258258
urchin <- sdrop_na(urchin, sex)
259259
chart(data = ___, ___ ~ ___ %col=% ___ %shape=% ___) +
260-
geom_point(___)
260+
geom_point()
261261
```
262262

263263
```{r 2factor_graph_h3-hint-2}
264264
urchin <- sdrop_na(urchin, sex)
265265
chart(data = DF, YNUM ~ XNUM %col=% FACTOR1 %shape=% FACTOR2) +
266-
geom_point(___)
266+
geom_point()
267267

268268
#### Attention : solution dans le 'hint' suivant! ####
269269
```
@@ -272,7 +272,7 @@ chart(data = DF, YNUM ~ XNUM %col=% FACTOR1 %shape=% FACTOR2) +
272272
## Solution ##
273273
urchin <- sdrop_na(urchin, sex)
274274
chart(data = urchin, weight ~ buoyant_weight %col=% origin %shape=% sex) +
275-
geom_point(na.rm = TRUE)
275+
geom_point()
276276
```
277277

278278
```{r 2factor_graph_h3-check}
@@ -285,41 +285,41 @@ Intéressez-vous maintenant à la hauteur (`height`) en fonction de la masse (`w
285285

286286
```{r}
287287
a <- chart(data = urchin, height ~ weight %col=% origin) +
288-
geom_point(na.rm = TRUE)
288+
geom_point()
289289
b <- chart(data = urchin, log(height) ~ log(weight) %col=% origin) +
290-
geom_point(na.rm = TRUE)
290+
geom_point()
291291

292292
combine_charts(list(a, b), labels = NULL, common.legend = TRUE, legend = "right")
293293
```
294294

295-
Réalisez un nuage de points montrant le **logarithme de la hauteur** en ordonnée et le **logarithme de la masse** en abscisse. Utilisez la couleur afin de différencier l'origine des individus et précisez à nouveau que vous souhaitez bien éliminer les valeurs manquantes de manière tacite.
295+
Réalisez un nuage de points montrant le **logarithme de la hauteur** en ordonnée et le **logarithme de la masse** en abscisse. Utilisez la couleur afin de différencier l'origine des individus.
296296

297297
```{r log_log_h4, exercise = TRUE}
298298
chart(data = ___, ___ ~ ___ ___ ___) +
299-
geom_point(___)
299+
geom_point()
300300
```
301301

302302
```{r log_log_h4-hint-1}
303303
chart(data = DF, ___ ~ ___ %col=% ___) +
304-
geom_point(___)
304+
geom_point()
305305
```
306306

307307
```{r log_log_h4-hint-2}
308308
chart(data = urchin, YNUM ~ XNUM %col=% FACTOR) +
309-
geom_point(___)
309+
geom_point()
310310
```
311311

312312
```{r log_log_h4-hint-3}
313313
chart(data = urchin, log(YNUM) ~ log(XNUM) %col=% FACTOR) +
314-
geom_point(___)
314+
geom_point()
315315

316316
#### Attention : solution dans le 'hint' suivant! ####
317317
```
318318

319319
```{r log_log_h4-solution}
320320
## Solution ##
321321
chart(data = urchin, log(height) ~ log(weight) %col=% origin) +
322-
geom_point(na.rm = TRUE)
322+
geom_point()
323323
```
324324

325325
```{r log_log_h4-check}

0 commit comments

Comments
 (0)