Erfolgsfaktor nachvollziehbare Datenqualität

Die SATW untersucht bestehende Standards und Massnahmen, um den Austausch von Daten unter Forschenden zu vereinfachen, im SWITCH Innovation Lab.

Text: Manuel Kugler, publiziert am 26.11.2019

Im Zeitalter von Big Data generiert jeder Mensch pro Tag hunderte Megabyte Daten, Tendenz steigend. Die Anforderungen an diese sind im Allgemeinen relativ gering und der Grossteil wird kaum wiederverwendet. In der Forschung, wo die Gewinnung aufgrund teurer Messgeräte oder aufwändiger Befragungen kostspielig sein kann, sollte das anders sein. Forschungsdaten breit zugänglich zu machen, ist ein Ziel der Open-Science-Bewegung und im Speziellen von Open Data.

Daten müssen FAIR sein

Die Verwaltung von Forschungsdaten stellt die internationale Wissenschaftsgemeinschaft vor unterschiedliche Herausforderungen. Um diese zu meistern, gibt es aktuell diverse Initiativen, auch in der Schweiz. So hat sich der Schweizerische Nationalfonds SNF verpflichtet, von der Öffentlichkeit finanzierte Forschung möglichst kostenlos öffentlich zugänglich zu machen. swissuniversities erarbeitet ein Open-Science-Programm, damit Schweizer Hochschulen Forschungsdaten wiederverwenden und verbreiten können. Daran sind auch die Akademien der Wissenschaften Schweiz beteiligt, die in ihrem kürzlich publizierten Factsheet Empfehlungen zur Förderung von Open Access und Open Data abgeben. Die zentralen Prinzipien dieser Initiativen lassen sich mit dem Akronym FAIR zusammenfassen: Auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reusable).

Die Dokumentation von Forschungsdaten hängt von der jeweiligen Wissenschaft ab

Für Austausch und Wiederverwendung von Forschungsdaten ist eine nachvollziehbare Datenqualität zentral. Forschende müssen wissen, wie Rohdaten prozessiert wurden und Gewissheit haben, dass diese nicht manipuliert wurden. Dies verlangt nach einer entsprechenden Dokumentation, etwa in Form von Metadaten. Besonders wichtig ist dies, wenn Daten aus unterschiedlichen Forschungsrichtungen zusammengeführt werden. Da in den jeweiligen Wissenschaften unterschiedliche Daten anfallen, kommen auch andere Beschreibungsmerkmale zur Anwendung.

Nachvollziehbare Datenqualität für ein Forschungsdaten-Konnektom

Die Stiftung SWITCH hat jüngst die SWITCH Innovation Labs lanciert – Plattformen für die Zusammenarbeit mit Hochschulpartnern. Um das Schweizer Open-Science-Ökosystem und die Erstellung eines Forschungsdaten-Konnektoms zu fördern, wurden zwei Labs definiert: «Nachvollziehbare Datenqualität» und «Technologien für ein Forschungsdaten-Konnektom». Für das erste Lab wurde die SATW beauftragt. Verständliche Metriken für die Qualität von Daten sind eine Voraussetzung, um Forschungsdaten disziplinenübergreifend teilen zu können.

Neben neuen Forschungsfragen und Erkenntnissen ermöglicht eine nachvollziehbare Datenqualität eine bessere Reproduzierbarkeit von Resultaten. Bis anhin kann dies sehr aufwändig oder gar unmöglich sein. Allerdings kann die Forderung, Forschungsdaten offenzulegen und zu teilen, bei Forschenden auch Widerstand auslösen. Denn dadurch steigt das Risiko, dass Fehler in der Arbeit aufgedeckt und damit die Reputation der betroffenen Forschenden oder ihrer Institutionen beschädigt wird. Zudem darf die Dokumentation keinen wesentlichen Zusatzaufwand generieren – damit sich Forschende auf ihre Kernaufgaben konzentrieren können.

Expertenbefragung dokumentiert den Stand des Wissens

Die SATW sammelt mit Hilfe einer Expertenbefragung den Stand des Wissens und Massnahmen für eine breit abgestützte, nachvollziehbare Datenqualität in unterschiedlichen Forschungsbereichen. Dies in der Annahme, dass einzelne Disziplinen solche Aspekte unterschiedlich stark berücksichtigen und verschiedene Standards anwenden. Im Rahmen der Umfrage werden nationale Bedürfnisse und Probleme erfasst. Erste Resultate werden für Ende 2019 erwartet, allfällige Folgeaktivitäten werden ab 2020 initiiert.

Über den Autor
Manuel    Kugler

Manuel Kugler

Manuel Kugler ist seit 2016 bei der SATW und leitet die Schwerpunktprogramme Advanced Manufacturing und Künstliche Intelligenz. Er verfügt über einen Master in Materialwissenschaften der ETH Zürich. Bevor er zur SATW stiess, arbeitete er zuerst als Technischer Fachspezialist in der Gruppe für Mikro- und Nanosysteme und anschliessend als Projektleiter bei der greenTEG AG an der Entwicklung von thermoelektrischen Wärmeflusssensoren.

E-Mail

FAIR Daten für die Zukunft

Unsere Vision verteilte Forschungsdaten interdisziplinär breit zugänglich und nachhaltig nutzbar zu machen: das Forschungsdaten-Konnektom. 

Das Forschungsdaten-Konnektom

Weitere Beiträge