Jump to: navigation, search

Commun 3 - Référentiels et ontologies du droit

RÉFÉRENTIELS ET ONTOLOGIES DU DROIT

Bâtir une ontologie Core Open Law Europa, construite sur le droit français à partir d’un premier « noyau », fondé sur un dénominateur commun reprenant des parties ou ontologies existantes (ELI notamment), pouvoir y greffer de futurs modules répondant à des usages plus spécifiques, ouverts à des ontologies existantes, faire des ponts pour viser une meilleure interopérabilité et un croisement des données (Akoma Ntoso, Dublin Core, FOAF, Event, Time, etc.), typiquement avec le thésaurus Eurovoc, complété de sets de terminologies issus de la DILA.

Définition de la notion d'ontologie

Ce point nous semble important pour éviter les confusions et avoir une définition commune. Au concept d’ontologie, il est donné plusieurs sens ou interprétations.

Les ontologies recouvrent plusieurs ensembles de « données » :

  • le modèle de représentation de l’information et des connaissances, qui décrit les objets manipulés, les relations entre ces objets, les contraintes et connaissances associées ;
  • le vocabulaire de métadonnées qui a pour but de décrire les contenus (utilisé lors de l’indexation et de l’annotation des contenus, à l’étape de leur production, mais aussi mobilisé en consultation, par les outils d’accès, de recherche et de référencement), et s’appuie sur tout ou partie de l’ontologie, répondant à la question : quelle métadonnée est posée pour quelle nature de contenu ;
  • les langages contrôlés en eux-mêmes plus communément appelés référentiels, qui alimentent certaines propriétés de l’ontologie et le vocabulaire de métadonnées sont constitués de terminologies (thésaurus, lexique, glossaire…), de taxonomies, de listes d’autorité (codes, géographie, auteurs…). Les thésaurus, lexiques et autorités servent à qualifier et décrire le contenu en lui-même (terminologies descriptives), les taxonomies quant à elles servent à ranger/organiser et classifier le contenu.

Une ontologie commune ou générale sur un domaine métier doit se construire sous ces trois angles pour garantir le meilleur des apports et envisager l’introduction de services à valeur ajoutée. En effet, les ontologies et notamment les technologies du web sémantique qui les mettent en œuvre ont pour objectifs de faciliter l’accès aux contenus, leur compréhension par des machines, leur partage et leur mise en relation… Ici sont effectivement abordées les notions de qualité intrinsèque de l’information, d’interopérabilité, d’enrichissement et de mise en place de processus automatisé.

Présentation

L’idée est de construire une ontologie Core OLE du droit à partir d’un premier « noyau »', fondé sur un dénominateur commun, générique reprenant des parties ou ontologies existantes (ELI notamment). En développant de manière itérative une ontologie Core OLE au format standard OWL en intégrant les parties référentiels et vocabulaires de métadonnées au sein d'une application permettant de les manipuler et de les exporter dans un format RDF (SKOS a minima).

Développer une ontologie ouverte et modulaire qui :

  • prévoit le fait de pouvoir y greffer de futurs modules répondant à des angles métiers, à des usages plus spécifiques,
  • s’ouvre à des ontologies existantes et permet de faire des ponts pour viser une meilleure interopérabilité et un croisement des données (Akoma Ntoso, Dublin Core, FOAF, Event, Time, etc.),
  • intègre la partie vocabulaire de métadonnées : Voc OLE , permettant ainsi la compréhension et la manipulation par une machine (machine-readable);
  • comporte un module Référentiels : typiquement avec le thésaurus Eurovoc, complété de sets de terminologies (issus de la DILA par exemple mais aussi collectés à partir de différentes sources) de listes d’autorités (géographie, administrations émettrices, etc.)
  • demande qu’on réfléchisse à un premier cadre expérimental et nécessite que l’on ait défini au préalable un ou plusieurs usages cibles d’expérimentation.

Objectifs

  • Création d’une ontologie modélisant les sources du droit (autorités émettrices de normes), les types de texte et les liens entre les textes.
  • Améliorer la recherche dans les textes et documents juridiques.
  • Annoter, décrire les documents juridiques.
  • Favoriser l’harmonisation des données et documents publiés.
  • Répondre à un besoin général de standardisation.
  • Faciliter la vulgarisation.
  • Permettre des traitements automatisés.
  • Faciliter l’interopérabilité avec d’autres droits
  • Diminuer les coûts de publication du droit
  • Normaliser la production juridique et législative, le commentaire de jurisprudence.
  • Améliorer la navigation entre différents documents juridiques grâce à une qualification fine des relations existant entre eux.


Il convient de ne pas perdre de vue que nous poursuivons un objectif de livrable à la communauté Open Law qui soit évaluable, compréhensible et utilisable. En ce sens, il convient de définir un premier socle qui rendrait compte des travaux en cours et mènerait à des expérimentations concrètes.

Cet objectif de livrable ne peut ignorer les initiatives en cours (autour d’ELI, notamment) et doit faire en sorte qu’elles puissent se raccorder et s’accrocher à cette ontologie OLE.

Travail préparatoire

Recenser les actifs en matière de modélisation des objets du droit, dont une partie emprunte nécessairement aux ressources précédemment évoquées. Ce recensement a aussi pour objectif d’alimenter les travaux de définition de l’ontologie Core OLE. Cette étude aboutira à un document de présentation de ces actifs, document qui resterait évolutif.

Étudier les nombreuses options possibles pour l'élaboration de cette ontologie. Une étude permettrait de rencontrer des utilisateurs et contributeurs potentiels afin de leur faire préciser leurs besoins, de définir les normes et standards à adopter, l'architecture technique et les outils à mettre en place, en particulier pour les contributeurs qui ne participeront que si des interfaces simples sont mises à disposition dans le cadre d'un processus soigneusement élaboré. Par exemple, que pourrait apporter la plate-forme de ParisTech à un tel projet ? Quel type de bases de données est le plus adapté (RDF, graphes, documents...) ? Elle permettra la définition de la démarche/trajectoire à suivre car un projet comme l'ontologie du droit ne peut être mené à bien seulement au fur et à mesure, sans plan d'ensemble.

Si possible, une première expérimentation2 doit être lancée pour démontrer les capacités à utiliser ces ressources produites sur un cas d’usage « simple ».

Marche à suivre

Référente : Guiraude Lame

1. Collecter les cas d’usage et détailler les livrables attendus.

2. Collecter les sources d’information disponibles.

3. Recenser et publier les référentiels des sources du droit, des types de texte, de types de composant des textes, des types de relation. Choix d'une autorité de publication et du nom de domaine pour les URI.

4. Gouvernance des référentiels et ontologies du droit à définir [hors projet à ce stade]

5. Bâtir une ontologie Core OLE à partir d’un premier « noyau », fondé sur un dénominateur commun reprenant des parties ou ontologies existantes (ELI notamment),

6. Pouvoir y greffer de futurs modules répondant à des usages plus spécifiques, ouvert à des ontologies existantes , faire des ponts pour viser une meilleure interopérabilité et un croisement des données (Akoma Ntoso, Dublin Core, FOAF, Event, Time, etc.), typiquement avec le thésaurus Eurovoc, complété de sets de terminologies issus de la DILA.

Contributeurs

Marc-Henri Hurt, Ismael Ziani, Pierre-Alexandre Foray, Sumi Saint Auguste, Martine Degusseau, Gilles Delaporte, Hacène Cherfi, Raphaël Kaufman, Guiraude Lame, Marc Kürster, Guiraude Lame.

Emails de contact

pierre-alexandre.foray@dila.gouv.fr, gilles.delaporte@mondeca.com, s.saintauguste@lefebvre-sarrut.eu,

Bases de données

SARDE, Codes lois et règlements consolidés, Eurovoc, Edition Lois et décrets du Journal officiel (JORF),

Timing suggéré

  • 17 décembre 2015 : présenter un premier retour des travaux ainsi qu'une expérimentation

1 - Objectifs : s’entendent à court et à moyen terme comme une trajectoire. Document de présentation des objectifs, du périmètre et des actions, accompagné d’un planning de tâches et de rôles des intervenants.

2 - Expérimentation  : décembre - Cette expérimentation pourrait porter sur l’annotation d’un ensemble de documents juridiques et la transposition de la production ainsi effectuée dans une base de connaissances (un triple store open source par exemple) avec le croisement de données existantes issues de l’Office européen des publications et d’une autre source, par exemple DBPedia, DILA, etc.