Sortons nos données du placard pour les valoriser

Comment mieux valoriser les données ?
fulopszokemariann/Pixabay, CC BY-SA

En 2014, dans un contexte de plus en plus favorable à la science ouverte, Sylvie Damy (Informatique) et Bernard Debray (Astrophysique/Informatique) décident de mener un travail d’inventaire et d’exposition des données de la recherche de l’Observatoire des sciences de l’Univers terre homme environnement temps astronomie de Franche-Comté (OSU THETA). Une équipe « données de la recherche » se mobilise alors autour du projet et, en avril 2016, le portail dat@OSU est inauguré.

Pluridisciplinaire et interopérable avec les principales plates-formes de gestion et de partage de données nationales et internationales, il permet aux chercheurs de l’OSU THETA de décrire et d’exposer largement leurs données.

Très rapidement, l’équipe, de plus en plus sollicitée pour accompagner les chercheurs dès la création de leurs données puis tout au long de leur cycle de vie, propose des actions de formation et de sensibilisation. Émerge alors une véritable structure de soutien à la communauté scientifique de l’OSU.

En 2019, à la demande de l’Université Bourgogne Franche-Comté, le projet change d’échelle. dat@UBFC démarre ! Héritier des infrastructures et de l’expertise de l’équipe dat@OSU, le service dat@UBFC en a étendu les activités et les services. Aujourd’hui, il est un point d’entrée unique, à l’échelle de la région Bourgogne-Franche-Comté, pour toutes les questions relatives à la gestion et à la valorisation des données de la recherche.

Cela fait sept ans maintenant que le projet a été lancé. Et aujourd’hui, nous pouvons considérer que c’est un succès ! Il amène une réelle plus-value à la communauté scientifique d’UBFC : les services proposés permettent de répondre aux exigences des institutions pour la diffusion sans entrave des publications et des données issues de recherches financées sur des fonds publics. De plus, grâce à une meilleure gestion et à l’exposition des données, la visibilité et l’efficacité de la recherche locale sont renforcées. Enfin, le portail dat@UBFC est un formidable vecteur de transmission du savoir et du patrimoine scientifique régional.

Ouvir ses données, c’est aussi les valoriser

En 2014, des chercheurs du laboratoire Biogéosciences Dijon s’intéressent au problème des îlots de chaleur urbains qui sont, en quelque sorte, des « microclimats artificiels ». Il s’agit d’un phénomène climatique peu connu mais important, car il influence les températures, les précipitations, les taux et la répartition des polluants, le confort des citadins, etc. Il s’agit donc d’une donnée à prendre en considération, si possible lors de la conception de la ville, au minimum, dans la gestion de cette dernière.

C’est pourquoi le Centre de recherche en climatologie (CRC) du laboratoire Biogéosciences a mis en place le réseau météorologique météorologique MUSTARDijon : une quarantaine de sondes hygro-thermométriques qui permettent de mesurer la température de l’air estival, toutes les vingt minutes dans l’agglomération dijonnaise et, de produire des données brutes d’observation sur un laps de temps suffisamment significatif pour obtenir des résultats de longue durée, fiables et publiables.

Après une rencontre avec l’équipe dat@OSU et à défaut de pouvoir publier immédiatement, les chercheurs responsables du projet (Benjamin Pohl et Yves Richard) décident de jouer le jeu de l’ouverture en remplissant, dès 2015, une fiche de métadonnées sur le portail.

Exemple de Métadonnées du projet MUSTARDijon.
Fourni par l’auteur

Une métadonnée est une information qui renseigne, notamment, l’origine et la nature d’autres données permettant ainsi une (ré)utilisation pertinente de ces dernières. Très rapidement, cet affichage porte ses fruits. En effet l’environnement et le climat urbains sont alors des sujets en pleine expansion. Une dynamique est lancée et un réseau de chercheurs impliqués dans ces thématiques se met en place. Le CRC du laboratoire Biogéosciences et son travail sur les îlots urbains sont alors identifiés, non pas de manière « classique », grâce à la publication de leurs résultats – la quantité de données recueillies étant alors insuffisante pour une analyse et une publication –, mais bien grâce à la découverte de leurs données via le portail dat@OSU.

C’est ainsi que le réseau MUSTARDijon a intégré un service national d’observation (SNO) du CNRS, sous le nom d’OBSERVIL. Ce réseau, enrichi d’une trentaine de nouveaux capteurs, implique la mutualisation des données récoltées par onze observatoires des environnements urbains situés dans toute la France. Le SNO doit ouvrir l’accès aux données à toute la communauté scientifique et, à terme, à l’ensemble de la société. De plus, les recherches sur le climat urbain menées à Biogéosciences ont reçu, pour 5 ans, un financement européen. La boucle est bouclée !

Des données en héritage

Notre second exemple présente la transmission de l’ensemble des données d’une carrière : celle d’Hervé Richard, palynologue au laboratoire Chrono-environnement de Besançon. La palynologie est l’étude des grains de pollen et des spores, actuels ou fossiles. Cette discipline permet de décrire l’histoire d’un environnement végétal et de comprendre ses variations qui résultent de phénomènes naturels (ex : les changements climatiques) et/ou de l’activité humaine (ex : la déforestation, l’agriculture, l’élevage).

Cette démarche de transmission est l’aboutissement d’une réflexion qui a débuté dès le milieu des années 90. En effet la palynologie n’était pas encore une discipline très « connue », contrairement à aujourd’hui. Une première base des données de datations au carbone 14 effectuées sur des pollens récoltés depuis la fin des années soixante-dix, avait alors été compilée afin, notamment, de mettre en avant des évolutions, de pouvoir réaliser des comparaisons spatiales et temporelles.

Diagramme pollinique de la mardelle d’Assenoncourt – Bois des Capenottes.
Analyse pollinique de la mardelle d’Assenoncourt (Moselle, France) : Impact des pratiques agricoles sur la biodiversité végétale en milieu forestier, Fourni par l’auteur

Malheureusement, ce projet n’avait pas pu aboutir, mais l’idée de transmettre et de valoriser l’ensemble des données brutes, publiées ou non, récoltées au fil du temps est restée une préoccupation importante pour H. Richard. En 2017, il demande donc à une étudiante, dans le cadre de son Master d’archéologie, de classer, par sites étudiés, toutes les données récoltées et produites au cours de ses années d’exercice. Des dizaines de cartons de documents, en partie manuscrits, sont triés et un ensemble d’informations est extrait sous la forme de métadonnées.

Après avoir rencontré l’équipe dat@OSU, H. Richard décide de mettre en valeur ce travail d’inventaire en le décrivant sur le portail. L’ensemble représente aujourd’hui une collection de 357 fiches.

Ensuite, toujours dans un souci de transmission et de conservation, H. Richard souhaite aller plus loin en proposant, pour la quasi-totalité de ses fiches, un accès aux données originales. Ainsi, les documents associés à chaque site ont été numérisés et rendus accessibles via dat@OSU grâce à leur dépôt sur le serveur de données dédié du laboratoire Chrono-environnement (data-Chrono). Toutes les données compilées pendant la carrière d’Hervé Richard sont donc exposées sur le portail et rendues accessibles pour une grande partie d’entre elles. Il s’agit d’une collection très importante et d’une avancée considérable dans la manière de transmettre des résultats de recherche, en plus des publications réalisées tout au long d’un parcours professionnel.

Cette aventure, démarrée il y a sept ans, suite à la rencontre de deux personnes intéressées par les données de la recherche, a pris de l’ampleur. Désormais, dans le contexte très dynamique de la science ouverte, sept personnes travaillent sur ce projet, sensibilisent et accompagnent l’ensemble de la communauté UBFC, lui permettant ainsi de s’inscrire activement dans le mouvement de l’open data.


The Conversation

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

Albane Rossi */ Sylvie Damy**
*Ingénieure d'études Chargée de valorisation du projet dat@UBFC, Université Bourgogne Franche-Comté (UBFC) / ** Maître de conférences en informatique au laboratoire Chrono-environnement, Université Bourgogne Franche-Comté (UBFC)
Note : les points de vue, les opinions et les analyses publiés dans les articles de la série "Les belles histoires de la science ouverte" n'engagent que leurs auteurs. Elles ne sauraient constituer l’expression d’une position du ministère de l'Enseignement supérieur, de la Recherche et de l'Innovation.

Albane Rossi a reçu des financements de la région Bourgogne-Franche-Comté pour le projet dat@UBFC et des financements de l'OSU THETA, de l'Université de Franche-Comté, du CNRS et de la région Franche-Comté pour le projet dat@OSU.

Sylvie Damy a reçu des financements de la région Bourgogne-Franche-Comté pour le projet dat@UBFC et des financements de l'OSU THETA, de l'Université de Franche-Comté, du CNRS et de la région Franche-Comté pour le projet dat@OSU.