La loi République numérique : le text & data mining fait toujours débat

Martin Clavey Publié le
La loi République numérique : le text & data mining fait toujours débat
Le Sénat et l'Assemblée nationale devront transiger en commission mixte paritaire sur le text & data mining. // ©  HAMILTON/REA
Mardi 3 mai 2016, le Sénat vote solennellement la loi République numérique. Si députés et sénateurs se sont accordés sur les conditions d’accès aux publications scientifiques et les Mooc diplômants, la technique de text & data mining ne fait toujours pas consensus.

Dans le projet de loi République numérique, adopté mardi 3 mai au Sénat, députés et sénateurs se divisent toujours sur le text & data mining. Les chercheurs souhaitent utiliser cette technique pour fouiller des textes de façon automatique, tant en bio-informatique qu'en linguistique, par exemple. Mais ils font face à une insécurité juridique : peuvent-ils utiliser un outil d'analyse de masse sur des textes qu'ils ont le droit de lire ?

Alors que le gouvernement refusait d'entendre parler de cette problématique et préférait que ce sujet soit abordé par la seule Commission européenne, lors de leur vote, les députés ont introduit l'autorisation, pour les chercheurs, d'utiliser cette technique de fouille automatique de textes.

Le Sénat a abordé le sujet sous un autre angle, ne voulant surtout pas faire du droit au text & data mining une exception au droit d'auteur. Les sénateurs ont ainsi choisi de circonscrire l'utilisation du text & data mining aux textes faisant explicitement l'objet d'un contrat entre les organismes de recherche et les éditeurs.

De ce fait, et de façon étonnante, les chercheurs pourront utiliser cette technique sur des textes payants et payés par leur institution mais n'auront pas la possibilité de l'utiliser sur des textes gratuits, comme des articles en accès ouvert, des blogs ou des sites Internet.

Les deux chambres devront donc trouver un consensus lors de commission mixte paritaire. Et, selon le cabinet de la secrétaire d'État au Numérique, Axelle Lemaire, le sort du text & data mining lors de cette commission reste assez incertain.

Un timide accès ouvert aux publications scientifiques

Les autres points du projet de loi concernant l'enseignement supérieur et la recherche mettent sénateurs et députés d'accord. Alors que l'Assemblée nationale avait beaucoup discuté des différentes façons d'intégrer l'accès ouvert aux articles scientifiques et subi un lobbying intense de la part des éditeurs scientifiques comme des chercheurs, le Sénat s'est ainsi rallié au consensus auquel l'Assemblée était arrivée fin janvier.

La logique de ce consensus est assez différente de celle suivie par l'Union européenne en la matière. Bruxelles a choisi d'imposer, dans les règles de financement européen de la recherche, une publication accessible à tous après un certain délai. Le législateur français a, pour sa part, choisi d'interdire l'exclusivité de publication après un certain temps mais n'encourage pas la publication ouverte, restant au milieu du gué.

Les chercheurs auront le droit, mais pas l'obligation, de publier sur Internet leurs articles issus de travaux de recherche majoritairement financés par des fonds publics six mois (en sciences, technologie et médecine) ou douze mois (en sciences humaines et sociales) après la première publication dans une revue scientifique.

La révolution numérique des cursus fait consensus

Enfin, et alors que le gouvernement ne l'avait pas prévu, l'Assemblée et le Sénat ont convenu de permettre aux formations en ligne de se substituer aux cours en amphi. Les Mooc et autres formations numériques pourront donc être diplômants.

Martin Clavey | Publié le