Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Histogramme Couverture géographique #9

Closed
johanricher opened this issue Nov 1, 2023 · 5 comments
Closed

Histogramme Couverture géographique #9

johanricher opened this issue Nov 1, 2023 · 5 comments
Labels
Visualisation Implémentation d'un "indicateur"

Comments

@johanricher
Copy link
Collaborator

johanricher commented Nov 1, 2023

User story

Je suis
Un gestionnaire de catalogue.
Un administrateur ministériel des données.

Je veux
En tant que gestionnaire, j'ai un rôle de coordination. Je souhaite apprécier mon patrimoine de données au regard des besoins de standardisation et d'agrégation, d'ouverture ou plus simplement de sélection des jeux de données les plus pertinents pour mon usage. Je souhaite pouvoir évaluer la qualité de mon patrimoine et en promouvoir l'amélioration :

  • à partir d'indicateurs et/ou de visualisations basés sur les métadonnées,
  • en identifiant les jeux de données dont les métadonnées gagneraient à être complétées, actualisées, consolidées, etc.

Je peux
[Par exemple depuis l'univers PPRN #5 (base de travail de l'itération 2)]

[Distinguer mes jeux de données]
Identifier la part de jeux de données locaux et nationaux.
Visualiser la distribution spatiale de mes jeux de données.

Besoins associés (du plus au moins évident)

  • 4- Connaître la répartition des jeux de données sur une origine géographique
  • 32- Comparer la qualité des jeux de données produits au niveau national par rapport à ceux produits au niveau local

Implémentation

Superset chart type: Histogram

  • Abscisse : Couverture géographique
  • Ordonnée : Nombre de jeux de données

Métadonnées utilisées

Remarques

Après première production de l'indicateur

Comment l'indicateur en l'état répond aux besoins ?

L'indicateur permet de comprendre la répartition des jeux de données qui sont disponibles à l'échelle départementale. Aussi, il permet d'analyser la répartition des jeux de données entre l'échelle communale et départementale.

Filtré, l'indicateur permet de comparer la distribution de la couverture géographique. Par exemple, il pourrait comparer sur quel département les jeux de données PPRN sont les plus nombreux et constater des différences dans la production de ces données entre les départements.

Comment pourrait-il être amélioré (préconisations) ?

Les retours lors des entretiens utilisateurs sur cet indicateur ont permis de noter des pistes d'amélioration :

  1. Ajouter a minima la couverture géographique 'nationale'
  2. Ajouter les couvertures géographiques : 'régionale', 'EPCI' et 'SCOT'
  3. Ajouter les jeux de données dont la couverture géographique ne correspond pas à une délimitation administrative

De manière plus complexe, cet indicateur pourrait être utilisé pour analyser la répartition géographique des différents champs d’un même jeu de données. Il faudrait néanmoins que l’outil ouvrir le jeu de données, ce qui n’est pas le cas actuellement.

@johanricher johanricher added the Visualisation Implémentation d'un "indicateur" label Nov 1, 2023
@johanricher
Copy link
Collaborator Author

johanricher commented Nov 1, 2023

@qloridant A vérifier au préalable pour préciser l'implémentation :

  • Est-ce que le champ spatial_coverage est renseigné pour tous les jeux de données ? Sinon comment est déclarée la couverture géographique ?
  • Comment déterminer à partir des valeurs renseignées pour le champ spatial_coverage si un jeu de données couvre un territoire local (et lequel) ou le territoire national ?

@Thesauruv
Copy link
Collaborator

Thesauruv commented Nov 2, 2023

@johanricher voir également mon commentaire dans le ticket #10

Pour l'identification de la couverture géographique, passer par les URI de l'Insee (par ex http://id.insee.fr/geo/departement/48) de la proriété dcterms:spatial est une solution rapide, mais cette information est moins présente les bounded boxes que j'avais utilisées pour le graphe en copie ci-dessous (avec la règle utilisée pour les catégories). De manière générale, pour l'interprétation de chacun des graphes, il est important que l'on sache le niveau de couverture des métadonnées associées.

departments_range = range(
    departments["area_km2"].min().astype(int), 
    max(departments["area_km2"].max(), regions["area_km2"].min()).astype(int))

regions_range = range(
    max(departments["area_km2"].max(), regions["area_km2"].min()).astype(int), 
    regions["area_km2"].max().astype(int))

supra_regional = range(
    regions["area_km2"].max().astype(int),
    regions["area_km2"].sum().astype(int))

metropolitan_data["category"] = metropolitan_data["area_km2"].apply(lambda x:
    "01_Intra-départemental" if (int(x) < departments["area_km2"].min().astype(int)) 
    else "02_Départemental" if (int(x) in departments_range)
    else "03_Régional" if (int(x) in regions_range)
    else "04_Suprarégional" if (int(x) in supra_regional)
    else "05_Supranational" if (int(x) > regions["area_km2"].sum().astype(int)) 
    else None)

image

@Thesauruv
Copy link
Collaborator

Potentiellement, une cellule avec le nombre de datasets associés sous une carte communale/départementale/etc.

@qloridant
Copy link
Collaborator

Basé sur le champ spatial, j'ai recensé deux cas différent, afin de reproduire au maximum la distribution proposée par @Thesauruv

  • Couverture communale : quand la liste des URI INSEE comporte au moins une ref à une commune
  • Couverture départementale : quand la liste des URI INSEE comporte au moins une ref à un département et aucune référence communale.

@clementmandron
Copy link
Collaborator

@qloridant on est d'accord que la barre de l'histogramme "Intra-départemental" correspond uniquement aux communes (ou aussi à d'autres strates administratives infre-départementale?).
En d'autres termes, pourrait-on renommer le label "Nombre de jdd dont la couverture géo est une commune" ?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Visualisation Implémentation d'un "indicateur"
Projects
None yet
Development

No branches or pull requests

4 participants