La traçabilité de la qualité des données

La SATW étudie les normes et mesures existantes afin de simplifier l’échange de données entre les chercheurs dans un SWITCH Innovation Lab.

Texte: Manuel Kugler, publié le 26.11.2019

À l’ère du big data, chaque personne génère des centaines de mégaoctets de données par jour, avec une tendance à la hausse. Les exigences envers ces données sont généralement assez faibles et la majorité d’entre elles ne sont guère réutilisées. Il devrait en être autrement dans le domaine de la recherche, où leur obtention peut s’avérer onéreuse en raison d’équipements de mesure coûteux ou d’enquêtes complexes. Rendre les données de recherche largement accessibles est l’un des objectifs du mouvement Open Science et plus particulièrement de l’Open Data.

Les données doivent être «FAIR»

L’administration des données de recherche confronte la communauté scientifique internationale à différents défis. Pour les relever, diverses initiatives sont en cours, y compris en Suisse. Ainsi, le Fonds national suisse FNS s’est engagé à rendre, dans la mesure du possible, les données issues de recherches financées par le public gratuitement accessibles à tout un chacun. swissuniversities développe actuellement un programme «Open Science», permettant aux hautes écoles suisses de réutiliser et de propager des données de recherche. Les Académies suisses des sciences y participent également et ont émis, dans leur Factsheet publiée récemment, des recommandations sur la promotion de l’Open Access et de l’Open Data. Les principes fondamentaux de ces initiatives peuvent être résumés par l’acronyme FAIR: faciles à trouver (findable), accessibles (accessible), interopérables (interoperable) et réutilisables (reusable).

La documentation des données de recherche dépend du domaine scientifique

La traçabilité de la qualité des données est essentielle pour l’échange et la réutilisation des données de recherche. Les chercheurs ont besoin de savoir comment les données brutes ont été élaborées et qu’elles n’ont pas été manipulées. Cela nécessite une documentation appropriée, par exemple sous forme de métadonnées. Cela est particulièrement important lorsque des données provenant de différents domaines de recherche sont compilées. Étant donné que les sciences concernées génèrent différentes données, elles utilisent également d’autres caractéristiques descriptives.

La traçabilité de la qualité des données pour un connectome de données de recherche

La fondation SWITCH a récemment lancé les SWITCH Innovation Labs – des plateformes pour la coopération avec des partenaires de hautes écoles. Deux laboratoires ont été définis afin de promouvoir l’écosystème d’Open Science suisse ainsi que la création d’un connectome de données de recherche: «La traçabilité de la qualité des données» et «Les technologies au service d’un connectome des données de recherche»». La SATW a été mandatée pour le premier laboratoire. Des mesures compréhensibles de la qualité des données sont une condition préalable au partage interdisciplinaire des données de recherche.

La traçabilité de la qualité des données permet non seulement de poser de nouvelles questions de recherche et d’obtenir de nouveaux résultats, mais aussi d’améliorer la reproductibilité des résultats. Pour le moment, cela peut s’avérer très laborieux, voire impossible. Toutefois, l’exigence de divulguer et de partager des données de recherche peut aussi se heurter à la résistance des chercheurs. En effet, cela augmente le risque que des erreurs dans les travaux soient découvertes et que la réputation des chercheurs concernés ou de leurs établissements en pâtisse. De plus, la documentation ne doit pas générer une charge de travail supplémentaire trop importante, afin que les chercheurs puissent se concentrer sur leurs tâches essentielles.

Une enquête menée auprès d’experts documente l’état des connaissances

En menant une enquête auprès d’experts, la SATW recueille l’état des connaissances et des mesures pour une traçabilité de la qualité des données compréhensible et généralisée dans différents domaines de recherche. Cette démarche repose sur l’hypothèse que les différentes disciplines tiennent compte de ces aspects à des degrés divers et appliquent des normes différentes. Cette enquête recense les besoins et les problèmes au niveau national. De premiers résultats sont attendus d’ici fin 2019 et les activités de suivi éventuelles débuteront à partir de 2020.

L'auteur
Manuel    Kugler

Manuel Kugler

Manuel Kugler a rejoint SATW en 2016 et dirige les programmes prioritaires Advanced Manufacturing et Intelligence artificielle. Il est titulaire d'une maîtrise en science des matériaux de l'ETH Zurich. Avant de rejoindre SATW, il a d'abord travaillé comme spécialiste technique dans le groupe des micro et nanosystèmes, puis comme chef de projet chez greenTEG AG pour le développement de capteurs thermoélectriques de flux thermique.

E-mail

Données de recherche FAIR

Notre vision est de rendre les données de recherche partagées largement accessibles et durablement utilisables, de manière interdisciplinaire, dans le cadre du patrimoine national de recherche: le connectome des données de recherche.

Le connectome des données de recherche

Autres articles