Skip to content

Commit

Permalink
Built site for gh-pages
Browse files Browse the repository at this point in the history
  • Loading branch information
Quarto GHA Workflow Runner committed Nov 27, 2024
1 parent 80af692 commit 7f254e8
Show file tree
Hide file tree
Showing 7 changed files with 34 additions and 38 deletions.
2 changes: 1 addition & 1 deletion .nojekyll
Original file line number Diff line number Diff line change
@@ -1 +1 @@
f815bd2f
a120803e
6 changes: 3 additions & 3 deletions chapters/chapter2/3-random_forest.html
Original file line number Diff line number Diff line change
Expand Up @@ -263,7 +263,7 @@ <h2 id="toc-title">On this page</h2>
<ul class="collapse">
<li><a href="#réduction-de-la-variance-par-agrégation" id="toc-réduction-de-la-variance-par-agrégation" class="nav-link" data-scroll-target="#réduction-de-la-variance-par-agrégation">Réduction de la variance par agrégation</a></li>
<li><a href="#convergence-et-limite-théorique-au-surapprentissage" id="toc-convergence-et-limite-théorique-au-surapprentissage" class="nav-link" data-scroll-target="#convergence-et-limite-théorique-au-surapprentissage">Convergence et limite théorique au surapprentissage</a></li>
<li><a href="#facteurs-influençant-lerreur-de-généralisation" id="toc-facteurs-influençant-lerreur-de-généralisation" class="nav-link" data-scroll-target="#facteurs-influençant-lerreur-de-généralisation">Facteurs influençant l’erreur de généralisation</a></li>
<li><a href="#sec-facteur-perf-rf" id="toc-sec-facteur-perf-rf" class="nav-link" data-scroll-target="#sec-facteur-perf-rf">Facteurs influençant l’erreur de généralisation</a></li>
</ul></li>
<li><a href="#sec-rf-oob" id="toc-sec-rf-oob" class="nav-link" data-scroll-target="#sec-rf-oob">Evaluation des performances par l’erreur <em>Out-of-Bag</em> (OOB)</a></li>
<li><a href="#interprétation-et-importance-des-variables" id="toc-interprétation-et-importance-des-variables" class="nav-link" data-scroll-target="#interprétation-et-importance-des-variables">Interprétation et importance des variables</a>
Expand Down Expand Up @@ -415,8 +415,8 @@ <h3 class="anchored" data-anchor-id="convergence-et-limite-théorique-au-surappr
<p>Bien qu’elle s’avèrent très performantes en pratique, <strong>il n’est pas prouvé à ce stade que les forêts aléatoires convergent vers une solution optimale</strong> lorsque la taille de l’échantillon tend vers l’infini (<span class="citation" data-cites="louppe2014understanding">Louppe (<a href="#ref-louppe2014understanding" role="doc-biblioref">2014</a>)</span>). Plusieurs travaux théoriques ont toutefois fourni des preuves de convergence pour des versions simplifiées de l’algorithme (par exemple, <span class="citation" data-cites="biau2012analysis">Biau (<a href="#ref-biau2012analysis" role="doc-biblioref">2012</a>)</span>).</p>
<p>Par ailleurs, une propriété importante des forêts aléatoires démontrée par <span class="citation" data-cites="breiman2001random">Breiman (<a href="#ref-breiman2001random" role="doc-biblioref">2001</a>)</span> est que leur erreur de généralisation, c’est-à-dire l’écart entre les prédictions du modèle et les résultats attendus sur des données jamais vues (donc hors de l’échantillon d’entraînement), diminue à mesure que le nombre d’arbres augmente et converge vers une valeur constante. Autrement dit, <strong>la forêt aléatoire ne souffre pas d’un surapprentissage croissant avec le nombre d’arbres</strong>. La conséquence pratique de ce résultat est qu’inclure un (trop) grand nombre d’arbres dans le modèle n’en dégrade pas la qualité, ce qui contribue à la rendre particulièrement robuste. En revanche, une forêt aléatoire peut souffrir de surapprentissage si ses autres hyperparamètres sont mal choisis (des arbres trop profonds par exemple).</p>
</section>
<section id="facteurs-influençant-lerreur-de-généralisation" class="level3">
<h3 class="anchored" data-anchor-id="facteurs-influençant-lerreur-de-généralisation">Facteurs influençant l’erreur de généralisation</h3>
<section id="sec-facteur-perf-rf" class="level3">
<h3 class="anchored" data-anchor-id="sec-facteur-perf-rf">Facteurs influençant l’erreur de généralisation</h3>
<p>L’erreur de généralisation des forêts aléatoires est influencée par deux facteurs principaux :</p>
<ul>
<li><p><strong>La puissance prédictrice des arbres individuels</strong> : Les arbres doivent être suffisamment prédictifs pour contribuer positivement à l’ensemble, et idéalement sans biais.</p></li>
Expand Down
Loading

0 comments on commit 7f254e8

Please sign in to comment.