new exercise C02La_cv

GuyliannEngels · GuyliannEngels · commit 848a8e0a62d1 · 2020-10-06T10:25:22.000+02:00
diff --git a/.gitignore b/.gitignore
@@ -25,3 +25,6 @@
 
 # RSconnect
 rsconnect
+
+/inst/tutorials/**/*.html
+/inst/tutorials/**/tests
diff --git a/inst/tutorials/C01La_confusion/C01La_confusion.Rmd b/inst/tutorials/C01La_confusion/C01La_confusion.Rmd
@@ -1,10 +1,10 @@
 ---
 title: "Matrices de confusion"
 author: "Guyliann Engels & Philippe Grosjean"
-description: "**SDD III** Exercices sur les matrices de confusion."
+description: "**SDD III Module 1** Exercices sur les matrices de confusion."
 tutorial:
   id: "C01La_confusion"
-  version: 1.1.0/4
+  version: 1.1.1/4
 output:
   learnr::tutorial:
     progressive: true
diff --git a/inst/tutorials/C02La_cv/C02La_cv.Rmd b/inst/tutorials/C02La_cv/C02La_cv.Rmd
@@ -0,0 +1,178 @@
+---
+title: "Validation croisée"
+author: "Guyliann Engels & Philippe Grosjean"
+description: "**SDD III Module 2** La validation croisée"
+tutorial:
+  id: "C02La_cv"
+  version: 1.0.0/5
+output:
+  learnr::tutorial:
+    progressive: true
+    allow_skip: true
+runtime: shiny_prerendered
+---
+
+```{r setup, include=FALSE}
+BioDataScience3::learnr_setup()
+SciViews::R()
+library(mlearning)
+
+set.seed(42)
+# exercice preparation --------
+read("biometry", package = "BioDataScience") %>.%
+  select(., gender, weight, height, wrist) %>.%
+  drop_na(.) -> bio
+
+## Creation d'un modèle lda
+bio_lda <- mlLda(data = bio, gender ~ .)
+
+## Confusion 
+bio_conf <- confusion(cvpredict(bio_lda, cv.k = 10), bio$gender)
+conf_tab <- summary(bio_conf)
+```
+
+```{r, echo=FALSE}
+BioDataScience3::learnr_banner()
+```
+
+```{r, context="server"}
+BioDataScience3::learnr_server(input, output, session)
+```
+
+----
+
+## Objectifs
+
+- Réalisez une analyse discriminante linéaire avec la validation croisée.
+
+## Création de votre modèle
+
+Vous avez à votre disposition le jeu de données `bio` dont un résumé est proposé ci-dessous. 
+
+```{r, echo = TRUE}
+skimr::skim(bio)
+```
+
+Ce tableau comprend `r ncol(bio)` variables. La variable `gender` est une variable facteur avec 2 niveaux : M (men), W (Women). Il y a également 3 variables numérique qui sont les attributs sur les items :  
+
+- weight : la masse en kg
+- height : la taille en cm
+- wrist : la circonférence du poignet en mm
+
+
+
+Réalisez un modèle avec `bio`. Prédisez la variable `gender` à l'aide des 3 variables numériques. 
+
+```{r lda1_h2, exercise = TRUE}
+bio_lda <- mlLda(data = ___, ___ ~ ___)
+summary(bio_lda)
+```
+
+```{r lda1_h2-hint-1}
+bio_lda <- mlLda(data = bio, ___ ~ ___)
+summary(bio_lda)
+
+## Attention, le prochain indice est la solution ##
+```
+
+```{r lda1_h2-solution}
+## Solution ##
+bio_lda <- mlLda(data = bio, gender ~ .)
+summary(bio_lda)
+```
+
+```{r lda1_h2-check}
+grade_code("Votre modèle est une réussite.")
+```
+
+*La formule doit être écrite sous sa forme condensée*
+
+## Performance de votre modèle.
+
+Vous venez de créer votre outils de classification qui se nomme `bio_lda`. Vous devez maintenant tester les performances de votre modèle avec une validation croisée dix fois
+
+```{r lda2_h2, exercise = TRUE}
+set.seed(42)
+# prédiction sur le set de test
+bio_pred <- cvpredict(___, cv.k = ___)
+# matrice de confusion
+bio_conf <- confusion(___, ___$___)
+# analyse du résultat 
+bio_conf
+summary(bio_conf)
+```
+
+```{r lda2_h2-hint-1}
+set.seed(42)
+# prédiction sur le set de test
+bio_pred <- cvpredict(bio_lda, cv.k = 10)
+# matrice de confusion
+bio_conf <- confusion(bio_pred, ___$___)
+# analyse du résultat 
+bio_conf
+summary(bio_conf)
+```
+
+```{r lda2_h2-solution}
+set.seed(42)
+# prédiction sur le set de test
+bio_pred <- cvpredict(bio_lda, cv.k = 10)
+# matrice de confusion
+bio_conf <- confusion(bio_pred, bio$gender)
+# analyse du résultat 
+bio_conf
+summary(bio_conf)
+```
+
+```{r lda2_h2-check}
+grade_code("Vous venez de réaliser vos premiers tests de performance.")
+```
+
+Analysez vos premiers tests de performance 
+
+```{r lda_qu}
+quiz(
+  question("Combien d'items sont correctement classés ?",
+    answer(sprintf("%1.f", sum(conf_tab$TP)), correct = TRUE),
+    answer(sprintf("%1.f", sum(conf_tab$Auto))),
+    answer(sprintf("%1.f", conf_tab$Manu[1])),
+    answer(sprintf("%1.f", conf_tab$TN[2])),
+    answer("Aucune des réponses proposées"),
+    allow_retry = TRUE,
+    incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
+    correct = "Bravo, c'est correct !"
+    ),
+  question("Quel est le taux d'erreur global (en %) ?",
+    answer(sprintf("%.1f", 100*(1-(sum(conf_tab$TP)/sum(conf_tab$Auto)))), correct = TRUE),
+    answer(sprintf("%.1f", 100*(sum(conf_tab$TP)/sum(conf_tab$Auto)))),
+  answer(sprintf("%3.f", sum(conf_tab$Auto)-sum(conf_tab$TP))),
+    answer(sprintf("%3.f", conf_tab$TN[2])),
+    answer("Aucune des réponses proposées"),
+    allow_retry = TRUE,
+    incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
+    correct = "Bravo, c'est correct !"
+    ),
+  question("Quel est la spécificité pour les femmes (F) ?",
+    answer(sprintf("%.3f", conf_tab[row.names(conf_tab) == "W", ]$Specificity), correct = TRUE),
+    answer(sprintf("%.3f", conf_tab[row.names(conf_tab) == "M", ]$Fscore)),
+    answer(sprintf("%3.f", sum(conf_tab$Auto)-sum(conf_tab$TP))),
+    answer(sprintf("%.3f", conf_tab[row.names(conf_tab) == "W", ]$Recall)),
+    answer("Aucune des réponses proposées"),
+    allow_retry = TRUE,
+    incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
+    correct = "Bravo, c'est correct !"
+    )
+  )
+```
+
+## Conclusion
+
+```{r comm_noscore, echo=FALSE}
+question_text(
+  "Laissez-nous vos impressions sur cet outil pédagogique",
+  answer("", TRUE, message = "Pas de commentaires... C'est bien aussi."),
+  incorrect = "Vos commentaires sont enregistrés.",
+  placeholder = "Entrez vos commentaires ici...",
+  allow_retry = TRUE
+)
+```