Konnektom-Pilotphase in vollem Gange

Möglichkeiten, wissenschaftliche Daten zu finden, zu untersuchen und zu verwalten: Pilotpartner erstellen Prototyp ganz nach den Bedürfnissen der Forschenden.

Publiziert am 07.07.2020

Ziel des ersten Pilot-Sprints für das Konnektom ist es, bis November 2020 Anwendungsfälle und Teile der Architektur des Forschungsdaten-Konnektoms zu definieren und zu validieren. Die Pilotpartner erstellen einen Prototypen nach den Bedürfnissen der Forschenden als künftige Nutzer. Dieses Verständnis liegt allen Arbeitspaketen der einzelnen Sprints zugrunde: der Festlegung und Modellierung einer Ontologie für den Konnektom-Wissensgraphen, dem Aufbau einer Schnittstelle zwischen Forschungsdatenrepositorien und dem Konnektom-Prototypen, der Evaluation des Datenflusses und der Verbindungen innerhalb der Konnektom-Plattform. 

Zusammen mit den Pilotpartnern wurden 20 Forschende für halbstrukturierte Interviews gewonnen, um die Gewohnheiten, Prozesse, Probleme und Bedürfnisse im Umgang mit Forschungsdaten zu bestimmen. Die teilnehmenden Forschenden sind am gesamten Prototyping-Prozess beteiligt und werden in unterschiedlichen Phasen des Entwicklungsprozesses zu Rate gezogen.

«Daten zu finden, hat mit Glück und Spürsinn zu tun»

Es war nicht überraschend, dass sich die Gewohnheiten und Bedürfnisse je nach den Fachgebieten der Forschenden und den Forschungsprozessen stark unterscheiden. Allen gemeinsam ist allerdings, dass sie Schwierigkeiten mit dem Zugang zu Daten, deren Auffindbarkeit und der Datenqualität haben.

Wie finde ich wichtige Informationen? Viele Forschende finden es schwierig, sich einen guten Überblick über die relevanten Daten zu verschaffen, da der Zugang zu Informationen vielfach durch Gebühren, Datenschutzmassnahmen oder das Datenformat beschränkt wird. Ein weiteres Problem besteht darin, die richtige Kombination von Suchbegriffen auszuwählen, um relevante Informationen zu finden. Viele waren der Meinung, dass es in der Schweiz und im Ausland zwar zahlreiche Datensätze gibt, zu denen Zugang und Verknüpfungen hilfreich wären, dass wissenschaftliche Daten im Allgemeinen aber dezentral gespeichert werden und schwer zu finden sind.

Welche verwandten Forschungsthemen gibt es in meinen Forschungsbereichen? Ein Forscher ging sogar so weit zu behaupten, dass es aufgrund der fehlenden digitalen Infrastruktur, aber auch wegen der fehlenden Bereitschaft, Daten innerhalb der Forschung auszutauschen, «Glück und Spürsinn brauche, um Daten zu finden». So wüssten die Forschenden oft auch nicht, dass andere Kollegen ähnliche Themen bearbeiten, auch wenn diese sogar Daten generieren, die für die eigene Forschung nützlich sein könnten. Eine andere Aussage lautete: «Es wäre toll zu wissen, wer Datensätze genutzt hat, mit welchen anderen Datensätze diese verknüpft wurden und so weiter.»

Ist dieser Datensatz vertrauenswürdig? Auf die Frage nach der Wiederverwertung von Daten erwähnten viele Forschende, dass ihnen das Vertrauen in die Qualität der gefundenen Daten fehle. «Datenqualität lässt sich schwer definieren und erreichen», hiess es, «und ist nicht einmal für bereichsspezifische Qualitätskennzahlen gesichert. Manchmal gibt es Best-Practices, aber ich denke, dass mehr Sorgfalt bei den Metadaten und der Methodik angebracht wäre, die verwendet werden, um die Daten zu generieren.»

Möglichkeiten, Forschungsdaten im Konnektom zu finden, zu untersuchen und zu verwalten

Das Konnektom soll den Nutzern entweder exakte, verwandte oder näherungsweise Datensätze von wissenschaftlicher Relevanz bereitstellen, die während des Forschungsprozesses ein bestimmtes Bedürfnis erfüllen. Um wissenschaftliche Informationen zu finden, sind Suchfunktionen nötig, die eine grössere Auswahl potenziell relevanter Daten anzeigen, welche die Nutzer dann durch verschiedene Filtermethoden eingrenzen müssen. Der Sucherfolg wird jedoch nicht allein von den Suchfunktionen bestimmt. Auch verschiedene Strategien können zum Erfolg führen, wie das Erstellen oder die Nutzung bereits vorgefertigter Anfragen, das Überwachen der aktuellsten Änderungen an den Datensätzen und die Quellenauswahl.

Zu den Discovery Funktionen, die in der Pilotphase erarbeitet und beurteilt werden sollen, zählen «Search and Filter» sowie die stärker auf die Suche ausgerichteten Funktionen «Query Generator» (z. B. «meine sozialen Netzwerke durchsuchen»), «Recommendation» und «Monitor». Im Gegensatz zu den traditionellen Such- und Filterfunktionen stellt der «Query Generator» einen Arbeitsablauf dar, um die Nutzer auf der Grundlage von Profilen und Beziehungen durch den Prozess zu führen, den es beim Bestimmen relevanter wissenschaftlicher Daten aus den wichtigsten Quellen zu durchlaufen gilt. Eine andere Möglichkeit, potenziell relevante wissenschaftliche Daten zu finden, sind persönliche «Recommendation».

Ein weiterer Aspekt, der gemeinsam mit den Forschenden im Zusammenhang mit dem Prototyp bearbeitet und validiert wird, sind Funktionen, um Daten zu verwalten, d. h. Sammlungen von wissenschaftlichen Daten zu erstellen, zu speichern, zu bearbeiten, zu teilen, zu importieren und zu exportieren.

Nächste Schritte

Auf der Grundlage der Erkenntnisse aus den Interviews und Beurteilungen von Anwendungsfällen entwickelt eine Partneragentur Benutzerschnittstellen und führt das Prototyping dazu aus. Sobald diese Prototypen erstellt sind, testen die befragten Forschenden die Anwendungsfälle und Nutzerprozesse. Ziel ist es, mit den Pilotpartnern eine solide Basis zu erarbeiten, um bis November 2020 ein Mindestangebot für das Konnektom zu definieren.

 

 

Das Forschungsdaten-Konnektom

Wissenschaftler aus unterschiedlichsten Fachgebieten generieren im Zuge ihrer täglichen Forschungsarbeit immer mehr wertvolle Daten. Diese wissenschaftlichen Daten wiederverwerten oder gar kombinieren zu können, würde den Weg für zahlreiche spannende Anwendungsfälle ebnen. Bisher wurden Forschungsdaten isoliert in den einzelnen Bereichen oder Einrichtungen gesammelt und waren schwierig zu verknüpfen.

Das Forschungsdaten-Konnektom verbindet und verwaltet (offen zugängliche) wissenschaftliche (Meta-)Daten nachhaltig und fachbereichsübergreifend, um sicherzustellen, dass diese weithin zugänglich, nützlich und interoperabel sind. Der Konnektom-Prototyp wird gemeinsam von DaSCH, FORS, EPFL Blue Brain, eXascale Infolab, SATW, SAGW, SDSC und SWITCH entwickelt.

Weitere Beiträge