Phase pilote du connectome bat son plein

Comment trouver, explorer et organiser l’information scientifique? Les partenaires pilotes construisent le prototype sur la base des besoins des chercheurs.

Publié le 07.07.2020

L’objectif du Connectome Pilot Sprint 1 consiste à identifier et à valider les cas d’utilisation et certaines parties de l’architecture du connectome de données de recherche d’ici novembre 2020. Les partenaires pilotes construisent le prototype en se basant sur les besoins des chercheurs en tant que futurs utilisateurs. Cette compréhension alimente tous les modules de travail du sprint, tels que la définition et la modélisation d’une ontologie pour le graphique de connaissances du connectome, la construction d’une interface entre les dépôts de données de recherche et le prototype du connectome, ou encore l’évaluation du flux de données et des connexions au sein de la plate-forme du connectome.

En collaboration avec les partenaires pilotes, plus de 20 chercheurs ont été recrutés pour mener des entretiens semi-structurés, destinés à identifier les habitudes, les processus, les problématiques et les besoins en matière de gestion des données de recherche. Les chercheurs impliqués se sont engagés à participer à l’ensemble du processus de prototypage et seront consultés à plusieurs étapes du processus de conception.

«Trouver des données est une question de sérendipité et de chance»

Sans surprise, les habitudes et les besoins varient largement en fonction des processus de recherche et des disciplines des chercheurs. Cependant, tous avaient en commun des difficultés d’accès, de recherche et de qualité des données.

Comment puis-je trouver des informations pertinentes? De nombreux chercheurs ont du mal à obtenir une bonne vue d’ensemble des données pertinentes, car l’accès aux informations est largement limité par un paywall, une protection des données ou un format spécifique. Un autre problème auquel sont confrontés de nombreux chercheurs est le choix des bonnes combinaisons de mots-clés pour trouver des informations pertinentes lors d’une recherche. Beaucoup estiment qu’il existe de nombreux ensembles de données en Suisse et à l’étranger auxquels il serait utile d’avoir accès et avec lesquels il serait possible d’établir des liens, mais que les informations scientifiques ont tendance à être décentralisées et difficiles à trouver.

Quels sujets connexes d’activités de recherche existent dans mes domaines de recherche? Un chercheur est allé jusqu’à affirmer que «trouver des données est une question de sérendipité et de chance» en raison de l’absence d’infrastructure numérique, mais aussi d’une réticence à partager les données au sein des communautés de recherche. Par conséquent, ils ont également déclaré qu’ils ignoraient souvent que leurs collègues chercheurs travaillaient sur des sujets connexes, même si ces collègues produisaient des données qui pourraient être utiles à leurs recherches. Un autre chercheur a indiqué: «Ce serait formidable de savoir qui a utilisé des ensembles de données, avec quels autres ensembles de données ils sont reliés, etc.»

Cet ensemble de données est-il fiable? Interrogés sur la réutilisation des données, de nombreux chercheurs ont évoqué un manque de confiance dans la qualité des données qu’ils trouvent. «La qualité des données est difficile à définir et à obtenir», ont-ils déclaré, «et elle n’est même pas déterminée par des mesures de qualité spécifiques à un domaine. Les meilleures pratiques existent parfois, mais je crois qu’il serait vital de faire plus attention aux métadonnées et à la méthodologie utilisée pour générer les données.»

Comment trouver, explorer et organiser les données de recherche dans le connectome?

Le connectome a pour but de fournir à l’utilisateur un ensemble exact, connexe ou approximatif d’informations scientifiques pertinentes qui répondent à un besoin donné au cours du processus de recherche. Trouver des informations scientifiques nécessite actuellement des fonctionnalités de recherche qui renvoient vers un ensemble plus large d’informations potentiellement pertinentes, que les utilisateurs doivent restreindre grâce à diverses méthodes de filtrage. Cependant, le fait de «trouver» ne doit pas forcément être basé sur les seules fonctionnalités de recherche. D’autres stratégies peuvent également mener à la découverte, p. ex. la construction ou la préconstruction de requêtes, le suivi des derniers changements dans les ensembles de données et la sélection des sources.

Parmi les principales fonctionnalités de découverte qui seront conçues et évaluées au cours de la phase pilote figurent les fonctionnalités «Search and Filter» et celles, plus exploratoires, du «Query Generator» (p. ex. Interrogation de mes réseaux sociaux), ainsi que «Recommandation» ou «Monitor». Contrairement aux fonctionnalités traditionnelles de «Search and Filter», le «Query Generator» est un workflow conçu pour guider l’utilisateur dans le processus d’identification des informations scientifiques pertinentes à partir des sources les plus pertinentes en fonction de leurs profils et de leurs relations. Une autre façon de découvrir des informations scientifiques potentiellement pertinentes réside dans la «Recommandation» personnelle pour un utilisateur.

Un deuxième aspect qui sera conçu et validé en coopération avec les chercheurs dans le prototype porte sur les fonctions d’organisation des données: créer, sauvegarder, modifier, partager, importer et exporter des collections d’informations scientifiques obtenues.

Prochaines étapes

Sur la base des résultats des entretiens et de l’évaluation des cas d’utilisation, une agence partenaire concevra et prototypera des interfaces utilisateurs. Une fois ces prototypes développés, les chercheurs interrogés testeront les cas d’utilisation et les parcours utilisateurs. L’objectif est de disposer d’une base solide avec des partenaires pilotes pour définir un service minimum viable pour le connectome d’ici novembre 2020.

 

Le connectome de données de recherche

Les scientifiques de toutes les disciplines génèrent de plus en plus de données précieuses dans le cadre de leurs activités de recherche quotidiennes. Le fait de pouvoir réutiliser, voire combiner ces données scientifiques ouvre la voie à de nombreuses opportunités passionnantes. Jusqu’à présent, les données de recherche étaient collectées dans des silos thématiques ou institutionnels et ne pouvaient pas être facilement reliées.

Le connectome de données de recherche connecte et organise les (méta)données scientifiques (ouvertes) de manière durable et interdisciplinaire pour les rendre largement accessibles, interopérables et utiles. La construction d’un prototype de connectome est une initiative conjointe du DaSCH, FORS, EPFL Blue Brain, eXascale Infolab, SATW, SAGW, SDSC et SWITCH.

Autres articles