Jump to: navigation, search

Commun 4 Crowdsourcing des ressources juridiques en accès libre

CROWDSOURCING DES RESSOURCES OPEN ACCESS

Présentation

Création d’interfaces Web pour permettre l’enrichissement documentaire et sémantique par des communautés de juristes (crowdsourcing) et le co-design des services aux juristes (interface de partage des données d’usage des juristes pour personnaliser les services à offrir).

Objectif

Appliquer le crowdsourcing et son écosystème en milieu totalement ouvert en :

- s'appuyant sur des exemples existant

- faisant un inventaire de bonnes pratiques en matières juridiques,

- s'interrogeant sur les enjeux sous-jacents à l'ambition de mettre en place un outil permettant l'enrichissement de métadonnées partagées et ouvertes sur des corpus juridiques.

Bibliographie

Le crowdsourcing a notamment été développé dans les bibliothèques, cf. Bibliothèques, crowdsourcing, métadonnées sociales de Pauline Moirez – http://bbf.enssib.fr/consulter/bbf-2013-05-0032-007).


OMTAT annotation tool: semantical enrichment for legal document search, http://ceur-ws.org/Vol-1495/paper_12.pdf

Marche à suivre

Référent : Stéphane Cottin

1. Définir les données pouvant être crowdsourcées :

  • les métadonnées,
  • les conclusions des avocats, l'enrichissement de la jurisprudence (en prenant compte les exigences posées par la CNIL),
  • les liens entre les documents (arrêt lié à telle notion, tel texte…)
  • Casetext https://casetext.com/  (voir Fantasy Supreme Court : https://fantasyscotus.lexpredict.com/ )
  • les commentaires,
  • les cas de la vie de tous les jours,
  • les données chiffrées dans la jurisprudence et de la législation...


2. Définir les outils à mettre en commun :

  • identifiants,
  • (voir ontologie),
  • thésaurus (autocomplétion) (voir Bipa) (attention à la permanence du référentiel),
  • accompagnement à la saisie,
  • outils d'authentification SSO (à rapprocher de France Connect)...


3. Identifiant unique :

Un système de crowdsourcing implique certainement une alimentation depuis plusieurs sources pour la mise à disposition des textes juridiques à enrichir. Le dédoublonnage est donc fatalement un enjeu majeur pour alimenter un éventuel outil. Les avancées considérables sur les identifiants des textes juridiques (ELI, ECLI) doit permettre de résoudre rapidement cet écueil (adhérence avec le commun 2).


4. Référentiels à disposition :

Appeler et mobiliser une communauté à contribuer nécessite de la doter d'outils pertinents pour un travail efficace et efficient. La mise à disposition d'ontologie (adhérence avec le commun 3) et de référentiels est donc également un préalable à la réussite d'un tel projet.


5. Gouvernance :

La qualité des données produites nécessite de fait une harmonisation, un suivi et une validation avant d'être redéployées et réutilisées. L'illusion d'un modérateur unique à l'échelle des jeux de données concernés est également illusoire. En s'inspirant des expériences d'autres communautés ouvertes (collectif Démocratie ouverte http://democratieouverte.org/), un modèle auto-administré et responsabilisé par les acteurs identifiés et déclarés peut être interrogé pour évaluer sa pertinence dans une communauté de type juridique.


6. Rediffusion et réutilisation des données produites :

Ici l'enjeu est de définir les services utiles aux usagers (institutionnels, entreprises, associatifs, particuliers) pour bénéficier de cet enrichissement. (cf. liste des services de l'ABES à partir d'un catalogue commun en "crowdsourcing" http://www.abes.fr/IdRef/Services-disponibles-autour-d-IdRef/Exposition-des-donnees-d-autorite-et-partenariats).


Contributeurs

Stephane Cottin, Olivier Garry, Dan Kohn, Pierre Lasvigne, Sébastien Jeannard, Camille Le Douaron, Jeanne Levin, Elisabeth Autier, Florian Pagnoux.

Email de contact

stephane.cottin@gmail.com