L'enseignement supérieur et la recherche face à l'ouverture de ses données

Manon Pellieux Publié le
L'enseignement supérieur et la recherche face à l'ouverture de ses données
capture data // ©  Capture d'écran ministère d'Enseignement supérieur
L'ouverture des données, ou opendata, est en marche depuis plusieurs années dans l'enseignement supérieur. Aujourd'hui, c'est au tour de la recherche de s'engager plus franchement dans cette démarche. Entre la production, la diffusion et la réutilisation des données, plusieurs enjeux entourent la diffusion des données. Des enjeux discutés lors du colloque "L'action publique des données et les données de l'action publique" organisé en octobre dernier.

SIES, DEPP, DataESR : ces acronymes ne vous sont peut-être pas familiers et pourtant ce sont des sources régulièrement mobilisées pour décrire l'enseignement supérieur et la recherche d'un point de vue quantitatif. Récolter, produire, rationaliser, et se servir de ces données est un enjeu important pour l'enseignement supérieur et la recherche.

D'autant qu'aujourd'hui, les data sont aussi largement utilisées par les acteurs publics pour guider leur action. Une thématique largement discutée lors du colloque "L'action publique des données et les données de l'action publique" qui s'est tenu du 17 au 19 octobre sur le campus universitaire de Strasbourg. Organisé notamment par le laboratoire SAGE (Sociétés, Acteurs, Gouvernement en Europe), ce colloque a été l'occasion de réunir les producteurs et utilisateurs de ces données, de confronter leurs enjeux et usages.

Des données essentielles pour les observateurs de l'ESR et les médias

Dans l'enseignement supérieur, c'est le SIES (Sous-direction des systèmes d'information et des études statistiques) qui se positionne avant tout comme un organisme d'aide au pilotage. En interne, le SIES est le premier ré-utilisateur de ses propres données. "La mise en ligne des données permet d'éviter des demandes internes d'échanges d'informations entre services du ministère", souligne ainsi Emmanuel Wiesenburger, responsable du département des outils d'aide à la décision au MESR .

Par ailleurs, le SIES publie aussi de nombreuses données, via DataESR, la plateforme de données ouvertes du ministère. En 2014, lors de sa mise en place, la plateforme affichait 23 jeux de données. Huit ans plus tard, ce sont 156 jeux de données qui sont mis à disposition.

Les jeux de données ouvertes sont très divers. Ils vont des effectifs étudiants aux nominations à l'institut universitaire de France, en passant par les données sur Parcoursup. La publication de ces informations est essentielle pour les médias qui en tirent de précieux enseignements. Très régulièrement, des articles se fondent sur ces données, l'occasion d'explorer de nouveaux angles et de proposer des décryptages très fouillés.

Emmanuel Wiesenburger, responsable du département des outils d'aide à la décision au MESR, soulève par ailleurs que la publication des données est "une incitation forte et collective à améliorer leur qualité." Car en effet, l'ouverture des data permet parfois de repérer des erreurs ou des manques qui permettent ensuite de mettre à jour ces informations.

La recherche sur la voie de l'ouverture de ses données

Si les données ouvertes jusqu'ici concernent surtout l'enseignement supérieur, la recherche prend elle aussi le chemin de l'opendata. En juillet 2022, Sylvie Retailleau a d'ailleurs inauguré une nouvelle plateforme : Recherche Data Gouv. L'objectif est d'abord de proposer un lieu de stockage des données de recherche aux structures qui n'en possèdent pas. Ensuite, le ministère souhaite aussi que Recherche Data Gouv contribue "au rayonnement de la recherche française par le partage et l'ouverture des données".

Il n'y a pas que les chercheurs qui s'engagent dans un processus d'ouverture des données, les évaluateurs de la recherche aussi, et plus particulièrement le Hcéres (Haut conseil de l'évaluation de la recherche et de l'enseignement supérieur). Claude Guéant, directeur du département du numérique et des données au Hcéres, a ainsi annoncé durant le colloque strasbourgeois le plan d'ouverture des données liées à l'évaluation.

Un travail de transparence qui n'est pas encore mené aujourd'hui. Dans un premier temps, le Hcéres souhaite mettre dans un format plus facilement exploitable des informations déjà publiques. Alors qu'elles le sont actuellement en PDF, l'objectif est désormais de publier ces informations dans des formats qui facilitent la réutilisation comme excel, csv ou encore json.

Publier les données du Hcéres pour créer de la transparence

Pour commencer, le Hcéres s'engage à publier les métadonnées liées aux rapports d’évaluation. Il s'agit ici des informations d'identification des rapports comme le type d’entité évaluée, la date de publication ou encore l'url de téléchargement du rapport. La composition des comités d’experts sera également rendue exploitable via des jeux de données. Un élément important qui permettra par exemple de mieux connaître le profil des évaluateurs du Hcéres. Enfin, des informations générales sur les formations, établissements et unités de recherches évaluées seront également diffusées.

"L'objectif est de créer de la confiance avec de la transparence", a assuré Claude Guéant. De plus, la diffusion valorise ces données en leur donnant une vie après l'évaluation. "Tout le monde pourra ensuite s'en emparer et les analyser à leur tour. C'est aussi une manière de mieux reconnaître le travail de récolte et de vérification des données, qui est le fruit d'un long travail pour les équipes du Hcéres", estime ainsi directeur du département du numérique et des données du Haut Conseil.

Enfin, comme pour le SIES, ouvrir des données améliore leur qualité selon le Hcéres. Par la publication, un effet rétroactif et de collaboration avec les utilisateurs des données s’applique. Par exemple, des erreurs peuvent être signalées. Les utilisateurs consolident par leur usage, et leur réutilisation, les données initialement publiées. Le calendrier comprendra plusieurs étapes entre novembre 2022 et janvier 2024, date à laquelle devraient également être diffusées les données issues des rapports d'évaluation.

Si l'accès à des données sur l'enseignement se développe, ce n'est pas pour autant un long fleuve tranquille. Preuve en est avec les données sur les IPS (Indices de position sociale) des écoles et collèges. Deux ans auront été nécessaires, avec une saisie de la CADA (Commission d'accès aux documents administratifs) par le journaliste Alexandre Léchenet, ainsi qu'un passage au tribunal administratif, pour que le ministère de l’Éducation nationale diffuse finalement ces données.


Le refus de la diffusion des indices de position sociale
Les autorités publiques comme les ministères sont soumises au droit d'accès à l'information comme défini par le code des relations entre le public et l'administration. C'est grâce à ce droit d'accès, que le journaliste Alexandre Léchenet a saisi la CADA (Commission d'accès aux documents administratifs). Alors en poste à la Gazette des communes, il demande au service presse du ministère de l’Éducation nationale l'accès aux IPS (indices de position sociale) des écoles et collèges. Cet indice permet de mesurer les profils sociaux des élèves de chaque établissement. Il sert notamment à flécher des financements par académie et établissements. Après le refus du service presse de communiquer ces données, et la saisie de la CADA, le journaliste a finalement obtenu un avis favorable de cette dernière pour avoir accès aux IPS, estimant que les données se devaient d'être publiées. La procédure fût longue puisque la saisie de la CADA par Alexandre Léchenet datait du du 17 décembre 2019, et les données n'ont été rendues disponibles que le 5 octobre 2022.

Manon Pellieux | Publié le