Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

chore(pipeline): update xp data #178

Merged
merged 2 commits into from
Dec 15, 2023
Merged

Conversation

vmttn
Copy link
Contributor

@vmttn vmttn commented Dec 14, 2023

Contexte :

  • des données ont été saisies manuellement en août par l'équipe data·inclusion pour l'expérimentation dans l'Essonne
  • ces données ont été saisies dans la preprod de dora, puis exportées au format json via l'api dora. L'export est stocké dans le datalake (data/raw/2022-01-01/data-inclusion/*)

3 problèmes :

  • l'api dora au moment de l'export ne renvoyait pas toutes les informations saisies (notamment les modalités d'orientation)
  • les données sur la preprod peuvent être légitimement supprimées par l'équipe dora
  • il y a quelques surprises dans les données saisies (certains mails sont complétement faux en @example.com) et je pense que c'est simplement liée à la preprod
  • les données sont republiées ouvertement dans l'api et dans l'open data avec l'identifiant de source data-inclusion, ce qui est on ne peut plus ambiguë

Changements :

  • j'ai bougé les données dans ce google sheet dans le dossier drive data·inclusion, basé sur un template dans le même dossier, qui pourra être réutilisé à l'avenir
    • ça reste mouai mais ça permet d'être cohérent : on veut mettre en place un schéma de données ouvert et demander à des collectivités de saisir des données dans ce format. Être nos propres utilisateurs seraient assez instructif je crois!
    • je n'utilise pas grist car je trouve l'outil très limitant + c'est beaucoup plus simple d'embarquer des partenaires sur google sheet.
  • j'ai mis à jour les transformations pour récupérer ce format de fichier, en prenant soin de bien utiliser toutes les champs dispo (e.g. les modalités d'orientation...)
  • j'ai caché ces données de l'xp, qui ne seront désormais plus consommable que par dora sur l'api

Reste à faire :

  • faire la même chose pour l'offre nationale de PE saisie également en préprod

Copy link
Contributor

@vperron vperron left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Pas de grandes remarques ! Merci pour toutes les infos dans le message de PR.

@@ -438,6 +440,7 @@ def search_services(
query = query.filter(models.Structure.source != "agefiph")
if not request.user.is_authenticated or "dora" not in request.user.username:
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

j'espère que le username "adorable" n'existe pas ^^

@@ -438,6 +440,7 @@ def search_services(
query = query.filter(models.Structure.source != "agefiph")
if not request.user.is_authenticated or "dora" not in request.user.username:
query = query.filter(models.Structure.source != "soliguide")
query = query.filter(models.Structure.source != "data-inclusion")
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

nit sans intéret ici : de ce que je comprends les données soliguide et data-inclusion sont donc dispo si je ne suis pas authentifié ? Ou je loupe quelque chose ?

The xp data was previously extracted from dora in staging.
This hack has saved us some time, but it's time to stop.
First, the data could be wipped by the team at dora.
Second, it's difficult to update.
Following the migration of the xp data from dora staging to a clean
google sheet, this commit updates transformation accordingly.
@vperron vperron force-pushed the vmttn/chore/reresh-xp-essonne branch from 45e3745 to 491cd7a Compare December 15, 2023 08:48
@vperron vperron merged commit 87d3322 into main Dec 15, 2023
5 of 6 checks passed
@vperron vperron deleted the vmttn/chore/reresh-xp-essonne branch December 15, 2023 08:56
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants