You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: inst/tutorials/A02La_base/A02La_base.Rmd.inactive
+2-2Lines changed: 2 additions & 2 deletions
Original file line number
Diff line number
Diff line change
@@ -314,7 +314,7 @@ mean(v4)
314
314
```
315
315
316
316
```{r vec2-check}
317
-
grade_code("C'est cela : les fonctions génériques s'utilisent comme les autres, mais faites bien attention aux différentes formes possibles (que l'on appelle les **méthodes** de la fonction) !.")
317
+
grade_code("C'est cela : les fonctions génériques s'utilisent comme les autres, mais faites bien attention aux différentes formes possibles (que l'on appelle les **méthodes** de la fonction) !")
318
318
```
319
319
320
320
Certaines fonctions servent à **résumer** un ensemble de données, c'est-à-dire qu'elles les représentent avec une seule ou un petit nombre de valeurs. Ainsi, quelle que soit la taille du vecteur `v4`, sa moyenne est toujours un nombre unique. Ici, nous avons obtenu `NA`. Nous savons pourquoi. Les valeurs manquantes sont **contaminantes** dans les calculs. Il en suffit d'une seule pour que l'ensemble du résultat soit `NA`. Naturellement dans ce cas, c'est dommage, car la moyenne pourrait être *estimée* sur base des trois autres valeurs connues. L'argument `na.rm` permet de le faire... mais comment le savoir ? En lisant **la page d'aide de la fonction**. Pour cela, utilisez l'instruction `?` suivi du nom de la fonction. Dans RStudio, la page d'aide apparaît dans l'onglet **Help** (copie d'écran ci-dessous).
@@ -449,7 +449,7 @@ log(x) %>.%
449
449
grade_code("C'est exactement cela. Le chaînage des opérations rend le code bien plus lisible.")
450
450
```
451
451
452
-
Vous utiliserez aussi l'opérateur de pipe de R de base `|>`. Il s'utilise de façon similaire, sauf que le mebre de gauche est injecté comme premier argument dans la fonction à droite, et il ne faut pas (et même, on ne peut pas) indiquer où le mettre à l'aide du point `.`. Voici, à titre d'illustration, trois fois la même instruction, écrite en imbriquant les fonction, puis avec `%>.%`, et enfin, avec `|>`.
452
+
On retrouve plusieurs opérateur de pipe dans R. Par exemple, l'opérateur de pipe de R de base est `|>`. Il s'utilise de façon similaire, sauf que le membre de gauche est injecté comme premier argument dans la fonction à droite, et il ne faut pas (et même, on ne peut pas) indiquer où le mettre à l'aide du point `.`. Voici, à titre d'illustration, trois fois la même instruction, écrite en imbriquant les fonction, puis avec `%>.%`, et enfin, avec `|>`.
- Les encadrés gris dénotent des instructions entrées dans R. Si ce dernier renvoie des résultats, ils sont présentés dans des encadrés blancs juste en dessous.
58
60
59
-
- Toujours commencer par l'instruction `SciViews::R()` pour installer les différents outils (rassemblés dans des extensions du programme, appelées "packages" R) dont nous aurons besoin. Cette instruction peut comprendre des arguments comme `lang = "fr"`. Cet argument va avoir pour effet de définir le français comme langue par défaut (là où cela est supporté, mais malheureusement pas dans l'interface du logiciel ou les messages d'erreur).
61
+
- Toujours commencer par l'instruction `SciViews::R()` pour installer les différents outils (rassemblés dans des extensions du programme, appelées "packages" R) dont nous aurons besoin. Cette instruction peut comprendre des arguments comme `lang = "fr"`. Cet argument va avoir pour effet de définir le français comme langue par défaut (là où cela est supporté).
62
+
63
+
- L'anglais est la langue la plus employée en science des données. Les jeux de données employés sont encodés en anglais. En définissant le français comme langue par défaut, si une traduction est disponible, certains graphiques et tableaux que l'on va réaliser auront automatique des labels en français.
60
64
61
65
- Le jeu de données est disponible dans un package R : `BioDataScience`, spécialement préparé pour ce cours.
62
66
63
-
- L'anglais est la langue la plus employée en science des données. Les jeux de données employés sont encodés en anglais. En définissant le français comme langue par défaut, si une traduction est disponible, les graphiques que l'on va réaliser auront automatique des labels en français.
67
+
- La fonction `read()` permet de lire les données issues du package `BioDataScience`. La fonction `tabularise()` a pour objectif de formater correctement un tableau (et bien plus encore. Vous le découvrirez tout à long de ce cours).
64
68
65
69
Le point d'interrogation devant notre jeu de données renvoie vers une page d'aide, tout comme pour les fonctions.
66
70
@@ -80,12 +84,10 @@ bio <- sselect(biometry, -day_birth, -wrist, -year_measure)
80
84
81
85
Nous réalisons cette sélection avec la fonction `sselect()` en éliminant des colonnes du tableau que nous n'utiliserons pas (les variables `day_birth`, `wrist` et `year_measure`). Le résultat de cette fonction est assigné à `bio` grâce à l'opérateur d'assignation `<-` déjà vu dans le tutoriel précédent.
82
86
83
-
La fonction `kable()` du package {knitr} peut être appelée directement sans charger le package à l'aide de l'instruction `knitr::kable()`. Elle permet de formater correctement un tableau en Markdown. Utilisons-là maintenant pour présenter les huit premières lignes de notre jeu de données grâce à la fonction `head()`.
87
+
Utilisons la fonction `tabularise()` du package {tabularise} maintenant pour présenter les huit premières lignes de notre jeu de données.
84
88
85
89
```{r, echo=TRUE}
86
-
bio %>.%
87
-
head(., n = 8) %>.% # Garde les huit premières lignes
88
-
knitr::kable(., align = "c")
90
+
tabularise(bio, max.rows = 8)
89
91
```
90
92
91
93
**Notez ceci :**
@@ -97,8 +99,7 @@ Considérons maintenant uniquement les femmes. On peut filtrer les lignes d'un t
97
99
```{r, echo=TRUE}
98
100
bio %>.%
99
101
sfilter(., gender == "W") %>.%
100
-
head(., n = 8) %>.% # Garde les huit premières lignes
101
-
knitr::kable(., align = "c")
102
+
tabularise(., max.rows = 8)
102
103
```
103
104
104
105
Continuons à manipuler notre tableau en sélectionnant des colonnes et en filtrant les lignes en une seule opération. Pour sélectionner les femmes `gender == "W"` et retirer la colonne `age`, nous utiliserons :
@@ -107,8 +108,7 @@ Continuons à manipuler notre tableau en sélectionnant des colonnes et en filtr
107
108
bio %>.%
108
109
sfilter(., gender == "W") %>.% # Sélectionne les femmes
109
110
sselect(., -age) %>.% # Retire la colonne âge
110
-
head(., n = 8) %>.% # Garde les huit premières lignes
111
-
knitr::kable(., align = "c")
111
+
tabularise(., max.rows = 8)
112
112
```
113
113
114
114
Maintenant que nous avons vu comment lire, remanier et présenter des tableaux de données dans R (nous reviendrons sur ces notions plus tard), nous pouvons explorer ses potentialités pour réaliser des graphiques à la section suivante...
Réalisez un nuage de points montrant la masse en ordonnée et la masse immergée en abscisse. Utilisez la couleur afin de différencier l'origine des individus et différentes formes afin de différencier le sexe des individus. Précisez à nouveau que vous souhaitez éliminer les valeurs manquantes de manière tacite.
247
+
Réalisez un nuage de points montrant la masse en ordonnée et la masse immergée en abscisse. Utilisez la couleur afin de différencier l'origine des individus et différentes formes afin de différencier le sexe des individus.
248
248
249
249
Vous pouvez observer qu'une première ligne de code vous est fournie afin de retirer les lignes de tableau ne contenant pas l'information sur le sexe des individus. Vous apprendrez dans les prochains cours à manipuler vos jeux de données pour réaliser ce genre de chose par vous-mêmes.
Réalisez un nuage de points montrant le **logarithme de la hauteur** en ordonnée et le **logarithme de la masse** en abscisse. Utilisez la couleur afin de différencier l'origine des individus et précisez à nouveau que vous souhaitez bien éliminer les valeurs manquantes de manière tacite.
295
+
Réalisez un nuage de points montrant le **logarithme de la hauteur** en ordonnée et le **logarithme de la masse** en abscisse. Utilisez la couleur afin de différencier l'origine des individus.
0 commit comments