http://www.faz.net/-gyl-891sx
HERAUSGEGEBEN VON WERNER D'INKA, JÜRGEN KAUBE, BERTHOLD KOHLER, HOLGER STELTZNER
F+ Icon
F.A.Z. PLUS
abonnieren

Veröffentlicht: 19.10.2015, 06:00 Uhr

Digitalisierung Mehr Ordnung im Datenwust

Wissenschaftler und Studenten an Universitäten befragen Haushalte, vermessen Körperzellen oder analysieren historische Schriften. Bei allem fallen Daten an. Aber wohin bloß damit?

von Klara Walk
© dpa Berge von Daten fallen an den Unis an: Aber wohin damit?

Klaus Schäfers ist Elektroingenieur - und eine Art Künstler. Er produziert täglich Bilder, aber nicht mit Pinsel und Stift. Schäfers und seine Kollegen am European Institute for Molecular Imaging (EIMI) an der Universität Münster nutzen für ihre Kunstwerke Geräte mit solch schwerfälligen Namen wie Positronen-Emissions-Tomograph. Derzeit arbeiten die Wissenschaftler daran, die Bildgebungsverfahren solcher Tomographen zu verbessern. Egal ob die Maschine gerade eine Maus oder einen Menschen vermisst: Das Ziel der Forscher ist es, die Körperzellen und deren Funktionen so genau wie möglich abzubilden.

Bei den molekularen Fotoshootings kommen täglich 50 bis 100 Gigabyte an Daten zusammen. Die Forscher müssen die riesigen Bilddateien dann so speichern, dass alle Kollegen im Münsteraner Exzellenzcluster „Cells in Motion“ (CiM) sie finden und damit arbeiten können: Mathematiker und Physiker, aber auch Mediziner, Biologen und Informatiker brauchen zuverlässig Zugriff auf die Bilder. Datenmanagement sei deshalb das A und O, sagt Schäfers: „Ich bin kein gelernter Datenmanager, aber die Bilddaten zu sortieren und so abzulegen, dass alle Kollegen sie wiederfinden können, gehört einfach zu meiner täglichen Arbeit.“ Anders wäre die interdisziplinäre Zusammenarbeit unmöglich.

Forschungsdaten existieren, seit es Forschung gibt. Aber mit dem technischen Fortschritt sind die Daten, die Wissenschaftler erheben, auswerten und archivieren, immer häufiger digital. Die Münsteraner Tomographen-Bilder existieren als Datei auf einem Server. Auch Sozialwissenschaftler führen Umfragen mitunter online durch - solche Informationen sind von vorneherein elektronisch gespeichert. Sogar Geisteswissenschaftler arbeiten immer häufiger mit digitalisierten Texten - „Digital Humanities“ heißt das dann. Und so wachsen auch in der Wissenschaft die Datenberge - und Akademiker stehen vor der gleichen Frage wie Manager in der Wirtschaft: Wie bekommt man „Big Data“ bestmöglich in den Griff?

Experimente und Geld mit bisherigen Daten sparen

Die Deutsche Forschungsgemeinschaft (DFG) fordert seit Jahren, dass sogenannte Forschungsprimärdaten, also die reinen Zahlen, Zitate und Fakten, mindestens zehn Jahre auf geeigneten Speichern verfügbar sein sollen. Das würde der guten wissenschaftlichen Praxis dienen: Wissenschaftler können ihre eigenen Schlussfolgerungen gegenüber Kollegen einfacher belegen, wenn die Datenbasis mit ein paar Klicks zugänglich ist. Nicht zufällig fordern immer mehr wissenschaftliche Journale die Rohdaten an, aus denen Wissenschaftler die publizierten Ergebnisse gewonnen haben - das geht heute schnell, man braucht ja nur ein paar Dateien. Außerdem steigen die Möglichkeiten zur sogenannten Nachnutzung der Daten. Forscher könnten sich manch ein Experiment sparen, wenn die Daten für andere Forscher zugänglich auf Servern liegen würden, anstatt in Laborbüchern in einem Archivregal zu verstauben. Es ist nicht zuletzt ein Kostenfaktor: Experimente kosten Geld, vor allem, wenn sie mit teuren Geräten gemacht werden, wie es oft in den Naturwissenschaften passiert.

Mehr zum Thema

Solche Möglichkeiten eröffnen sich aber nur, wenn jemand die anfallenden Daten managt. Das heißt: Jemand muss dafür sorgen, dass sie strukturiert und einheitlich abgelegt werden. Und jemand muss entscheiden, wer Zugang zu den Daten erhält. Wissenschaftler werden durch die Digitalisierung also auch zu Verwaltern digitaler Archive.

Der Münsteraner Forscher Schäfers ist mit der Zeit in die Aufgaben eines Forschungsdatenmanagers hineingewachsen und kümmert sich freiwillig um dieses Thema: „Am Institut gab es einfach keinen, der die Expertise schon mitgebracht hätte“, sagt Schäfers. Also eignete er sich die nötigen Kompetenzen selbst an. Er hilft den Kollegen heute bei allen Fragen zum Speichern und Wiederfinden, zu Formaten und Dateinamen. Er kümmert sich um die Planung der technischen Infrastruktur, er erklärt, welche Bilder wo und mit welchen Metadaten abgelegt werden müssen.

Teilen ja, aber Kontrolle behalten die Forscher

Die Frage, die Schäfers dabei am meisten umtreibt: Wem gewähren die Forscher Zugang? „Wir arbeiten täglich am Balanceakt zwischen Transparenz und größtmöglicher Sicherheit der Daten“, sagt der Wissenschaftler. Denn einige Bilder auf seinen Servern sind sensibel: Es geht um Patienten-Informationen, um Innenansichten von Körpern; nicht jedem gefällt der Gedanke, dass Doktor Hinz und Professor Kunz Zugriff darauf haben könnten. Außerdem betrachtet Schäfers die Bilder als wissenschaftlichen Schatz: „Wir teilen sie durchaus, auch mit außeruniversitären Einrichtungen, aber wir wollen die Kontrolle behalten.“ Die Daten bleiben bei der Universität, auch wenn nicht nur Universitätsangehörige Zugriff darauf haben.

Um Fragen wie die nach einem sicheren Speicherort und nach Zugriffsberechtigungen in das Bewusstsein der wissenschaftlichen Öffentlichkeit zu rücken, hat die Hochschulrektorenkonferenz (HRK) im Mai 2014 Empfehlungen zum Umgang mit digitalen Forschungsdaten herausgegeben. „Wir wollten zunächst auf das Thema aufmerksam machen“, sagt Peter Schirmbacher, Professor für Informationsmanagement an der Berliner Humboldt-Universität (HU Berlin). Der Mitautor der HRK-Empfehlungen gibt zu: „Beim Management digitaler Forschungsdaten stehen wir noch am Anfang.“

36778788 © Peter von Tresckow Vergrößern

Doch die Hochschulen haben immerhin damit begonnen, und die HU Berlin gehört zu den Vorreitern. Peter Schirmbacher war bis September dieses Jahres Leiter des dortigen Rechenzentrums und hat gemeinsam mit seinen Kollegen aus der Universitätsbibliothek und dem Servicezentrum Forschung, einer internen Dienstleistungsstelle für die Wissenschaftler, das Projekt Datenmanagement vorangetrieben. Die Hochschulleitung hat ihn dabei unterstützt. Wer an der HU forscht, hat nun verschiedene Möglichkeiten, seine Daten der wissenschaftlichen Community und allen Interessierten zugänglich zu machen.

Die Wissenschaftler nutzen sogenannte Repositorien, eine Art digitale Speicher für Daten, ähnlich einer Online-Datenbank. Um ein für ihr Fach passendes Repositorium zu finden, können die Forscher zum Beispiel die Datenbank des von der DFG geförderten Projektes Re3Data.org nutzen: Dort sind Fach-Repositorien für die unterschiedlichsten Disziplinen verzeichnet. An der HU gilt: Daten sollten grundsätzlich so archiviert werden, wie es die jeweiligen Fachkreise empfehlen. So machen Wissenschaftler ihre Ergebnisse allen Kollegen zugänglich - nicht nur an der eigenen Universität, sondern im besten Fall auf der ganzen Welt. Wer das nicht möchte, kann auch das HU-eigene Medienrepositorium nutzen und dort festlegen, welche Nutzer Zugang zu den Daten haben sollen.

„Hochschule muss sich um das Datenmanagement kümmern“

Selbst die Geisteswissenschaften sind an Bord, das Klischee des im Elfenbeinturm sitzenden Bücherwurms stimmt schon lange nicht mehr. Beispiel: „Laudatio“, eine von der HU initiierte Datenbank für Forschungsdaten aus der historischen Linguistik. Digitale Forschungsdaten sind für Germanisten oder Historiker inzwischen ein bedeutender Forschungs-Rohstoff: Suchalgorithmen finden Muster in einem Text schneller als eine ganze Armee von Hilfskräften. Am Trier Center for Digital Humanities arbeiten der Informatiker Thomas Burch und das Team des Kompetenzzentrums mit Geisteswissenschaftlern zusammen daran, für geisteswissenschaftliche Forschungsfragen digitale Werkzeuge und ganze virtuelle Forschungsumgebungen zu schaffen. Mal geht es darum, in digitalisierten Wörterbüchern Verweise zu identifizieren, mal geht es um die Online-Edition eines literarischen Lebenswerks - aber immer sind digitale Daten im Spiel.

Das Management des digitalen Forschungsmaterials dürfte daher in den nächsten Jahren zu einer der wichtigsten strategischen Aufgaben der Hochschulleitungen werden. Forschung sei eine der Hauptfunktionen von Universitäten, und zur Spitzenforschung gehöre eben die seriöse und transparente Dokumentation der grundlegenden Daten, findet der Informations-Experte Schirmbacher: „Eine Hochschule, die als Forschungsstandort etwas auf sich hält, muss sich deshalb um das Datenmanagement kümmern.“

Zur Homepage