IA & Droit : Datasets d'apprentissage

Présentation

Le potentiel que représente pour le droit “l’Intelligence artificielle” et les technologies associées est au cœur des préoccupations de la communauté des juristes.

Pourtant, les applications sont aujourd'hui limitées, les professionnels de la legaltech manquant de données propres à la langue française et au langage juridique pour alimenter et faire progresser leurs algorithmes. Cette absence de données d’apprentissage ne permet pas non plus d’aborder la question des dangers éthiques liés au développement des outils d’intelligence artificielle. 

C’est la raison pour laquelle l’association Open Law Le droit ouvert*, dans le cadre de la mission "Ethique et Algorithme" de la CNIL, a décidé de solliciter sa communauté autour d’un projet sur les données d’apprentissage. 

Objectifs :

ï       Démontrer la faisabilité et l'utilité de constituer des jeux de données d’entraînement de qualité ; 

ï        Explorer des méthodologies de création de données d’apprentissage ;

ï        Documenter la démarche afin de lui conférer un caractère réplicable pour d’autres jeux de données.

Conformément aux principes érigés par l’association, le(s) jeu(x) de données produits seront par la suite exploitables par tous dans un format ouvert.

Constats
  • Manques de données d’entraînement propres à la langue française et au langage juridique.
  • Dangers éthiques liés au développement des outils d’intelligence artificielle sans données d’entraînement de qualité.
Solutions proposées
  • Utiliser la communauté Open Law, qui rassemble les compétences juridiques et techniques nécessaires, pour constituer un / plusieurs jeu(x) de données d’entraînement, qui serai(en)t par la suite exploitable(s) par tous.
  • Utiliser les données de Jurisprudence (dans un premier temps) : dans le prolongement des travaux engagés dans le cadre du programme Open Case Law
Coordinateur

Camille Ledouaron - ELS Francis Lefebvre

Agenda & Besoins

AGENDA & BESOIN IA & DROIT