Skip to content

Commit

Permalink
première version des slides réunion de cadrage
Browse files Browse the repository at this point in the history
  • Loading branch information
mhillion committed Dec 5, 2024
1 parent 0d633c6 commit a8e4077
Show file tree
Hide file tree
Showing 2 changed files with 346 additions and 13 deletions.
77 changes: 70 additions & 7 deletions Presentations/custom.css
Original file line number Diff line number Diff line change
@@ -1,7 +1,70 @@
.green2, .green2 code, .green2 a { color: #008A25!important; }
.red2, .red2 code, .red2 a { color: #EE0220!important; }
.blue2, .blue2 code, .blue2 a { color: #4758AB!important; }
.quarto-title-author-name {
color: #ec6842;
font-weight: bold;
}
/* Modification des tailles de police pour différents niveaux */
.reveal h1 {
font-size: 1.5em; /* Taille des titres de niveau 1 */
}

.reveal h2 {
font-size: 1em; /* Taille des titres de niveau 2 */
}

.reveal p {
font-size: 0.7em; /* Taille des paragraphes */
}

/* Ajout des styles personnalisés pour les couleurs */
.green2, .green2 code, .green2 a {
color: #008A25 !important;
}

.red2, .red2 code, .red2 a {
color: #EE0220 !important;
}

.blue2, .blue2 code, .blue2 a {
color: #4758AB !important;
}

/* Style pour le titre et le nom de l'auteur */
.quarto-title-author-name {
color: #ec6842;
font-weight: bold;
}

/* Ajout d'une classe pour réduire la taille de police sur certaines slides */
.smaller {
font-size: 0.8em;
}

/* Ajout d'une classe pour augmenter la taille de police si nécessaire */
.larger {
font-size: 1.2em;
}

/* Ajout d'un style générique pour les liens et les codes dans les slides */
.reveal a {
text-decoration: underline;
color: #4758AB; /* Couleur par défaut des liens */
}

.reveal code {
background-color: #f4f4f4;
color: #333;
padding: 0.2em 0.4em;
border-radius: 3px;
font-size: 0.85em;
}


.reveal p {
margin: 0.5em; /* Définit un espacement vertical de 1em autour des paragraphes */
}

.reveal ul {
margin-top: 0em; /* Espace au-dessus des listes */
margin-bottom: 0.5em; /* Espace en dessous des listes */
padding-left: 1em; /* Indente les listes */
}

.reveal ul li {
margin-bottom: 0em; /* Espace entre les points de la liste */
}
282 changes: 276 additions & 6 deletions Presentations/reunion_cadrage_06_12_2024.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -2,7 +2,7 @@
title: "Introduction aux méthodes ensemblistes"
subtitle: "Réunion de cadrage"
author:
- "Mélina Hillion et Olivier Meslin"
- "Olivier Meslin et Mélina Hillion"
date: "2024-12-06"
date-format: long
lang: fr-FR
Expand All @@ -16,18 +16,288 @@ format:
---




# Introduction

Bienvenue à cette présentation!
---

**Objectif principal**

- Intégrer les méthodes ensemblistes dans la boîte à outils des statisticiens publics, au même titre que la régression linéaire ou logistique.

. . .


**Pourquoi s'y intéresser ?**

- Méthodes devenues standard

- Facilité d'implémentation

- État de l'art

- Performances supérieures



---

# Deuxième Slide
**Pourquoi cette réunion de cadrage ?**

- **Valider notre approche avec vous**

- **Collecter vos besoins et vos suggestions**
+ Qu'attendez d'un tel document méthodologique?
+ Qu'est-ce qui faciliterait l'adoption de ces méthodes ?

- **Délimiter les contours du document**


## Agenda de la Réunion

1. Présentation du projet
2. Présentation du plan détaillé
3. Discussion sur les choix éditoriaux
4. Questions liées au contenu
5. Vos besoins et attentes
6. Notebooks et cas d'usage
7. Prochaines étapes


## Présentation du Projet

**Objectif du Document Méthodologique**

- Fournir un guide **complet et accessible** sur les méthodes ensemblistes pour les statisticiens publics.


. . .


**Bénéfices attendus**

- **Améliorer les compétences**

- **Améliorer la production de données et d'analyses**

- **Encourager l'adoption de techniques à l'état de l'art**

- Point 1
- Point 2
- **Point important**

## Présentation du plan détaillé

**1. Introduction**

- Contexte et objectifs.

. . .

**2. Aperçu des méthodes ensemblistes**

- Présentation intuitive sans formalisme.
- Pourquoi et comment les utiliser.

. . .

**3.Présentation formelle des méthodes**

- Détails mathématiques essentiels.
- Références aux travaux fondateurs.


## Présentation du plan détaillé

**4. Mise en pratique**

- Guides d'entraînement pour les forêts aléatoires et le gradient boosting.
- Recommandations et bonnes pratiques.

. . .

**5. Cas d'usage dans la statistique publique**

- Exemples concrets d'applications.

. . .

**6. Annexes et ressources**

- Références, liens utiles.



## Angles éditoriaux actuels
- **Approche progressive** : du général au spécifique, sans prérequis techniques.

- **Orientation pratique** : focus sur l'application et l'implémentation.

- **Accessibilité** : illustrations, exemples concrets.



# Discussion sur les Choix Éditoriaux

---

**1. Niveaux de lecture et organisation du contenu** :

- Aperçu intuitif
- Présentation formelle
- Guide pratique

. . .

- Option A :

+ Séparation claire entre la présentation des méthodes (théorie) et le guide pratique (application).

- Option B : Approche intégrée par méthode :

+ Section Forêts Aléatoires : Théorie + Pratique

+ Section Gradient Boosting : Théorie + Pratique

<!--
**Questions** :
- Quelle option faciliterait la compréhension et l'appropriation des méthodes ?
- Comment structurer le document pour qu'il soit le plus utile possible ?
-->

---

**2. Contenu des sections rédigées** :

- Les sections existantes sont-elles suffisamment claires ?

- Le niveau de détail vous semble-t-il approprié ?


. . .

**3. Optimisation des hyperparamètres** :

- Le niveau de détail sur l'optimisation des hyperparamètres est-il suffisant ?

- Souhaitez-vous plus d'exemples ou de recommandations pratiques sur ce sujet ?


. . .

**4. Présentation des algorithmes** :

- Est-il pertinent d'inclure des présentations des algorithmes en pseudocode ?

- Est-ce que cela nuit à la clarté ?


---

**5. Interprétabilité des modèles** :


- Faut-il dédier une section entière à l'interprétabilité des modèles ensemblistes ?

- Quelles approches d'interprétation souhaitez-vous voir expliquées ?

- Comment gérer les différences d'implémentation entre R et Python ?


. . .

**6. Recommandations d'implémentation** :

- Les implémentations recommandées (`ranger`, `scikit-learn`, `XGBoost`, `LightGBM`) vous conviennent-elles ?

- **Évaluation des performances** :

+ Erreur Out-of-Bag (OOB) vs Validation Croisée (CV)

+ Présenter les deux approches, en soulignant que l'OOB est spécifique aux forêts aléatoires?


## Vos besoins et attentes

- Qu'attendez-vous de ce document méthodologique ?

+ Formation, référence, guide pratique ?

- Quels sont les obstacles actuels à l'adoption des méthodes ensemblistes selon vous ?

- Quelles ressources ou outils faciliteraient leur intégration dans la pratique usuelle ?

- Comment pouvons-nous adapter le document pour qu'il réponde au mieux à ces/vos besoins ?


## Notebooks et cas d'usage


- **Deux applications simples** :

+ Prédire l'âge (régression)

+ Prédire le niveau de diplôme (classification)


- **Utilisation de données open data** :

+ Données individuelles du recensement de la population.


. . .


Langages et librairies :

- En R : Forêts aléatoires avec `ranger` pour régression et classification.

- En Python :

+ Forêts aléatoires avec `scikit-learn`.

+ Gradient boosting avec `scikit-learn`.

Cette répartition vous convient-elle ?


## Notebooks et cas d'usage

**Utilisation des pipelines `scikit-learn`** :

- Inclure cette approche pour diffuser les bonnes pratiques ?

- Avantage : Automatisation et reproductibilité.

- Inconvénient : Peut ajouter une couche d'abstraction.


. . .

**Couverture des cas d'usage** :

- Les exemples proposés sont-ils pertinents ?

- Y a-t-il d'autres cas d'usage que vous aimeriez voir abordés ?



## Prochaines Étapes

- Synthèse des retours

- Rédaction et révision

+ Finalisation des sections en cours.

- Développement des notebooks :
+ Ajout de nouvelles implémentations.
+ Mise à disposition sur le SSPCloud.


## Merci pour votre participation !

- Des questions supplémentaires ?

- Des commentaires ou suggestions ?

0 comments on commit a8e4077

Please sign in to comment.