Skip to content

Commit

Permalink
Bricole
Browse files Browse the repository at this point in the history
  • Loading branch information
oliviermeslin committed Nov 14, 2024
1 parent 9fa020c commit 42eb788
Showing 1 changed file with 10 additions and 3 deletions.
13 changes: 10 additions & 3 deletions chapters/chapter3/guide_usage_RF.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -28,6 +28,8 @@ Il existe de multiples implémentations des forêts aléatoires. Le présent doc

Cette section décrit en détail les principaux hyperparamètres des forêts aléatoires listés dans le tableau `@tbl-hyp-rf`{=typst}. Les noms des hyperparamètres utilisés sont ceux figurant dans le _package_ `R` `ranger`, et dans le _package_ `Python` `scikit-learn`. Il arrive qu'ils portent un nom différent dans d'autres implémentations des _random forests_, mais il est généralement facile de s'y retrouver en lisant attentivement la documentation.

::: {.content-visible unless-format="html"}

```{=typst}
#figure(
Expand All @@ -37,7 +39,7 @@ Cette section décrit en détail les principaux hyperparamètres des forêts al
table.header(
table.cell(colspan: 2)[
Hyperparamètre \
#text(box(image("./icons/logo-R.svg", height:2.4em))) #h(2.7cm) #text(box(image("./icons/logo-python.svg", height:2em))) \
#text(box(image("/icons/logo-R.svg", height:2.4em))) #h(2.7cm) #text(box(image("/icons/logo-python.svg", height:2em))) \
#h(0.8cm) #text(weight: "regular")[`ranger`] #h(1.8cm) #text(weight: "regular")[`scikit-learn`]
],
[Description]
Expand All @@ -54,8 +56,11 @@ Cette section décrit en détail les principaux hyperparamètres des forêts al
caption: [ Les principaux hyperparamètres des forêts aléatoires],
) <tbl-hyp-rf>
```
:::

::: {.content-visible when-format="html"}


<!--
| Hyperparamètre (`ranger` / `scikit-learn`) | Description |
| ------------------------------------------ | ----------------------------------------------------------------------------- |
| `mtry` / `max_features` | Le nombre de variables candidates à chaque noeud |
Expand All @@ -68,7 +73,9 @@ Cette section décrit en détail les principaux hyperparamètres des forêts al
| `max.depth` / `max_depth` | Profondeur maximale des arbres |

: Les principaux hyperparamètres des forêts aléatoires {tbl-colwidths="[30,70]"}
-->


:::

- Le __nombre de variables candidates à chaque noeud__ contrôle l'échantillonnage des variables lors de l'entraînement. La valeur par défaut est fréquemment $\sqrt p$ pour la classification et $p/3$ pour la régression. C'est l'hyperparamètre qui a le plus fort effet sur la performance de la forêt aléatoire. Une valeur plus basse aboutit à des arbres plus différents, donc moins corrélés (car ils reposent sur des variables différentes), mais ces arbres peuvent être moins performants car ils reposent parfois sur des variables peu pertinentes. Inversement, une valeur plus élevée du nombre de variables candidates aboutit à des arbres plus performants, mais plus corrélés. C'est en particulier le cas si seulement certaines variables sont très prédictives, car ce sont ces variables qui apparaitront dans la plupart des arbres.

Expand Down

0 comments on commit 42eb788

Please sign in to comment.