Les bibliothèques au cœur de la gestion des données de la recherche

Romain Ledroit Publié le
Les bibliothèques au cœur de la gestion des données de la recherche
Le stockage sécurisé des données de la recherche est un des enjeux des établissements de l'enseignement supérieur. // ©  Inria / Photo H. Raguet
Les SCD (services communs de la documentation) des universités sont des espaces privilégiés pour concevoir des offres dédiées aux données de la recherche. Ils agissent en transversalité dans les établissements et répondent aux enjeux de la science ouverte. Dans les pratiques du quotidien, comment se développent ces services ?

"L’importance des données dans le processus de recherche est de plus en plus criante. Et ces trois dernières années, plusieurs évolutions importantes en font un passage obligé, sous l’impulsion décisive de l’État, constate Julie Duprat, étudiante à l'Enssib (École nationale supérieure des sciences de l'information et des bibliothèques) et auteure d’une enquête sur les pratiques liées aux données de la recherche à l’université Bordeaux-Montaigne. Dès octobre 2016, la loi République numérique (article 30) apporte des précisions sur le statut de "données publiques" de la recherche. Le 4 juillet 2018, Frédérique Vidal annonce la priorité à venir sur la science ouverte, en affichant la volonté du gouvernement d'ouvrir autant que possible l'accès aux publications scientifiques et aux données de la recherche, en s'appuyant sur la mutation numérique. À sa création à l’automne 2018, le Comité science ouverte, relevant du MESRI, inclut également un groupe de travail 'données'."

Conscients des enjeux liés aux données de la recherche, plusieurs établissements du supérieur, comme l'université Bordeaux-Montaigne, réfléchissent à mettre en place un service dédié aux chercheurs, qui proposerait notamment de les accompagner dans la gestion leurs données de recherche.

Intérêt d'un service dédié

"Un service dédié aux données de la recherche permet de se positionner sur un angle mort de la recherche", rappelle Julie Duprat qui, à travers les entretiens réalisés auprès d'enseignants-chercheurs, de doctorants, ou du personnel d'appui à la recherche pour son enquête, a constaté que les habitudes de travail étaient relativement isolées quand il s’agit de gérer ces données. Ce serait particulièrement vrai pour les SHS (sciences humaines et sociales).

"Si, au moment de l'enquête, la plupart des interviewés n'avaient pas pleinement conscience des apports d'un tel service, ils se sont montrés intéressés par les possibilités offertes", se souvient l'auteure.

"Une partie des problématiques de la recherche est tournée vers les enjeux de l’open access et de la science ouverte. (Romain Féret)

À l'université de Lille, sur le campus sciences et technologies, le SCD s’est emparé de l’enjeu des données de la recherche dès 2013. Aujourd’hui, un peu plus de deux personnes en équivalent temps plein travaillent sur la gestion des données de recherche au SCD de l'université de Lille. "Une partie des problématiques de la recherche est tournée vers les enjeux de l’open access et de la science ouverte. Ce que l’on retrouve dans les objectifs d’Horizon 2020, de l’ANR (Agence nationale de la recherche). Le Coso (Comité pour la science ouverte), structure d'envergure nationale, participe aux grandes orientations", relève Romain Féret, chargé de mission open access et données de la recherche à Lilliad et membre du collège "Données de la recherche" du Coso.

Protection et stockage des données

Parmi les grandes priorités énoncées par le chargé de mission : le stockage sécurisé des données de recherche au sein des unités de recherche ou des établissements. Celles-ci doivent également être accessibles dans le temps pour pouvoir être réutilisées et vérifiées : d’où un axe mis sur l'archivage des données des projets en cours ou terminés.

Les éditeurs et les agences de financement ont une politique de la donnée impliquant leur conservation pendant cinq, voire dix années. C’est le cas lors de la publication d’un article. Autre enjeu : leur structuration sous forme de jeux de données en vue de leur publication. Enfin, il s’agit de penser leur usage en fonction des différentes disciplines, de la protection des données à caractère personnel et de la maîtrise de leur diffusion dans le cadre d’une valorisation économique.

Depuis le début de l’année 2018, 20 projets déposés à l’ANR, et 10 dans le cadre du programme Horizon 2020, sont accompagnés par le service des données à la recherche à Lilliad, et ce, dès la conception. Pour Romain Féret, la priorité est double : il s’agit d’intégrer une logique de science ouverte en transversalité de la démarche scientifique, gestionnaire et budgétaire, puis de construire une stratégie adaptée de dissémination et de valorisation des productions de la recherche, en respectant les critères de la science ouverte.

Transversalité

Face à la multitude d'enjeux liés à la gestion des données de la recherche, les responsables de ces services sont devenus des acteurs clés. "L’image la plus parlante pour notre rôle est celui du médiateur, plutôt que de l’opérateur. Notre fonction est d’accompagner par des outils et des méthodes de travail", remarque Joël Pollet, responsable du département Sidoc (système d'information documentaire) du SCD de l’Université de Nice.

Cette mission demande toutefois du temps et des compétences : "Nous sommes dépendants des temporalités des équipes de recherche, ce qui nécessite une réflexion en termes de gestion de ressources humaines. Par ailleurs, gérer les données de la recherche, c’est être formé à des compétences très spécifiques, notamment à des langages informatiques", poursuit Joël Pollet.

En conséquence, le positionnement de l’offre du SCD évolue vers le partage d’outils, plutôt que vers des accompagnements sur mesure. C’est le cas d’Omeka, un outil de création de collections de données bibliographiques et de bibliothèques numériques en ligne, à destination des projets de recherche, dont l'objectif est de garantir leur pérennité.

Les services liés aux données de la recherche se développent souvent dans les SCD. (Marie-Madeleine Géroudet)

"En France, les services liés aux données de la recherche se développent souvent dans les SCD. Cela s’explique par leur identité souvent transversale, en relation avec plusieurs dimensions de l’établissement", précise Marie-Madeleine Géroudet, responsable du service bibliothèque numérique à Lilliad, pilote de la commission recherche de l’ADBU (Association des directeurs et personnels de directions des bibliothèques universitaires et de la documentation) et membre du collège "données de la recherche" du Coso.

Par exemple, le SCD de l'université de Lille entretient des liens avec les DPO (data protection officers) de l'établissement, lorsqu’il s’agit de veiller au respect du règlement européen sur la protection des données, avec des comités éthiques, quand les données de santé sont en jeu, mais aussi avec les SATT (sociétés d’accélération du transfert de technologies), chargées du transfert et de la valorisation de la recherche, ou la direction des systèmes d’information quand il est question de stockage et d’archivage des données.

"La transversalité nécessaire aux services des données de la recherche doit se retrouver dans les profils des agents. Il faut une bonne connaissance des laboratoires et des personnes considérées comme légitimes par le milieu de la recherche, au sens où elles comprendront mieux les enjeux de traitement et de manipulation de données", rappelle Julie Duprat. Pour elle, il est nécessaire d’associer des savoirs de spécialité liés aux enjeux de l’open access et de la science ouverte à des compétences informationnelles et communicationnelles.

C’est aussi par l’appel à projets que les compétences entre bibliothécaires et chercheurs sont réunies. Le groupement d’intérêt scientifique CollEx-Persée a ouvert depuis 2018 un appel à projets centré sur "la numérisation de corpus pour la recherche et le développement de services aux chercheurs". Lors des deux journées professionnelles CollEx-Persée, des 4 et 5 avril 2019, organisées par cette infrastructure de recherche, plusieurs professionnels soulignent l’importance de projets transversaux pour accompagner le changement dans les SCD.

Trouver les relais en dehors de l’établissement

Aussi, comment se former à des thématiques en évolution rapide et aux référentiels multiples ? C’est le défi majeur des agents travaillant sur le sujet des données de la recherche. En pratique, c’est par de l’autoformation, de la veille et des échanges entre pairs qu'ils apprennent à s’ajuster aux contextes mouvants. C’est ainsi que Romain Féret indique consulter la veille du Jisc britannique, ou les blogs des universités de Cambridge, et de TU Delft, considérées comme pionnières en la matière.

La formation continue s'adapte à cet enjeu : l’Enssib a ouvert en 2019 un parcours de sept modules intitulé "Ouvrir la science et les données", co-construit par des spécialistes de l’Inist et du Muséum national d’histoire naturelle.

À Lille, Nice ou Bordeaux, on cite également l'importance des structures nationales dédiées aux données de recherche, notamment le Coso et l’Institut de formation scientifique et technique, qui produit des outils de formation de structuration des données de la recherche, ou encore le réseau des unités régionales de formation à l’information scientifique et technique. Dans le domaine des sciences humaines et sociales, Huma-num est indiquée à plusieurs reprises tout en soulignant l'enjeu de faire connaître les offres de service dans les établissements rencontrés.

Développer les services liés aux données de la recherche impliquera nécessairement de former les agents. Une priorité, selon Marie-Madeleine Géroudet : "Il faut croiser les approches. Les personnels des bibliothèques ont des compétences initiales sur l’archivage, la gestion de projets numériques ou les métadonnées, et ils peuvent monter en expertise. En parallèle, les établissements peuvent recruter d’autres profils qui ne sont pas initialement dans les SCD. Il est intéressant de suivre cette évolution d’ensemble dans la communauté de l’enseignement supérieur et la recherche." À ce titre, suivre la communauté, notamment présente aux deux jours du CollEx-Persée est un indicateur de la dynamique du changement à l’œuvre.

Romain Ledroit | Publié le