https://www.faz.net/-gyl-a6bil

Wissenschaft und Daten : Forschung aus zweiter Hand

  • -Aktualisiert am

Speichermedien werden für die Wissenschaft immer wichtiger Bild: Prisma Bildagentur

Wissenschaft mit fertigen Datensätzen breitet sich rasant aus. Sie entzweit die Lager. Für manche Studien ist sie unabdingbar, doch sie kann auch den Blick auf die Wirklichkeit verzerren.

          6 Min.

          In Marienthal, einem Dorf in der Nähe Wiens, wurde 1931 fast die gesamte Bevölkerung arbeitslos, weil die ortsansässige Textilfabrik schließen musste. Was für die Einwohner eine Katastrophe war, wurde für die Sozialwissenschaft zur Sternstunde. Unter der Leitung von Paul Lazarsfeld und Marie Jahoda protokollierte ein Soziologenteam mehrere Monate lang minutiös, wie die Arbeitslosigkeit das Dorfleben prägte, die Gewohnheiten der Bewohner änderte und auf ihre Psyche einwirkte.

          „Die Arbeitslosen von Marienthal“ ist eine Studie, die mit ihrer Kombination aus unmittelbarer Beobachtung und penibler Datenerhebung als Klassiker der empirischen Sozialforschung gilt. Auch heute gibt es noch Soziologen, die in dieser Tradition arbeiten. Aber viele forschen mittlerweile vor allem am Schreibtisch und vor dem Bildschirm: Sie konzipieren Untersuchungen, definieren Stichproben, entwerfen Fragebögen und werten die eingehenden Daten aus.

          Den unmittelbaren Kontakt zu den „Beforschten“ haben hingegen meistens freiberuflich tätige Interviewer, die anhand standardisierter Fragebögen Lebensverhältnisse oder Einstellungen erfragen. Und oft ist die Distanz der Wissenschaftler zu den Lebenswelten, die sie erforschen, sogar noch größer. Immer mehr Sozialwissenschaftler werten für ihre Studien Daten aus, die nicht sie selbst erhoben haben, sondern Kollegen vor ihnen.

          Replizierbarkeit von Studien

          Diese „Nachnutzung“ ist nicht nur in der Soziologie, sondern auch in den Wirtschaftswissenschaften, der Psychologie und den Erziehungswissenschaften mittlerweile weit verbreitet. Dafür gibt es gute Gründe, sagt der Wirtschaftswissenschaftler Gert G. Wagner vom Max-Planck-Institut für Bildungsforschung. „Datennachnutzungen sind sinnvoll, weil man Daten zur Vergangenheit nicht im Nachhinein erheben kann. Die Nachnutzung bereits erhobener Daten ermöglicht aktuelle Längsschnittuntersuchungen über Lebensläufe hinweg.“

          Ein Beispiel sind die großangelegten Studien des Sozio-oekonomischen Panels (SOEP), dessen Chef Wagner viele Jahre lang war. Sie untersuchen, wie soziale und wirtschaftliche Verhältnisse, Arbeitsbedingungen oder der Zugang zu Bildung Lebensläufe prägen. Gerade gestartet ist eine Studie mit 34 000 Teilnehmern, in deren Verlauf Wissenschaftler des SOEP und des Robert-Koch-Instituts (RKI) über mehrere Jahre hinweg die medizinischen und sozialen Auswirkungen der Corona-Pandemie untersuchen werden.

          Eine günstige Bedingung dafür, dass sich einmal erhobene Forschungsdaten zu späteren Zeitpunkten und auch unter verschiedenen thematischen Perspektiven erneut analysieren lassen, ist die Standardisierung der Fragen und möglichen Antworten. Das ist in der quantitativen Sozialforschung die Norm. Den methodischen Kern ihrer Projekte bilden die statistische Repräsentativität und die Orientierung am Ideal der Naturwissenschaften. Die Untersuchungsbedingungen sollen genau definiert und die Forschungsergebnisse replizierbar sein.

          Solche Replikationen sind ein wichtiger Anwendungsbereich der Datennachnutzung. In den vergangenen Jahren deckten Kontrollanalysen in einer Reihe bereits publizierter Arbeiten aus der Soziologie und der Psychologie gravierende Mängel bei der Erhebung oder Auswertung der Daten auf. Renommierte Journale wie die „Zeitschrift für Soziologie“ verlangen mittlerweile von ihren Autoren, ihre quantitativen Daten auf einem Replikationsserver zugänglich zu machen.

          Basislager der Daten

          Das Rückgrat der Forschung mit nachgenutzten Daten bilden 38 Forschungsdatenzentren, angesiedelt an Hochschulen und außeruniversitären Einrichtungen. Das SOEP und das RKI gehören ebenso dazu wie das Kraftfahrt-Bundesamt, die statistischen Ämter oder das Leibniz-Institut für Sozialwissenschaften. Wissenschaftler können dort auf Tausende von anonymisierten Datensätzen, oft zusammen mit Fragebögen, Protokollen und Stichprobenplänen, zugreifen. Teilweise sind die Daten für die wissenschaftliche Sekundäranalyse frei verfügbar, teilweise muss die Zustimmung der Primärforscher eingeholt werden.

          Im vergangenen Jahr haben über 55 000 Personen vom Bachelorstudenten bis zum Professor Daten aus diesen Forschungszentren genutzt. Rund 2360 wissenschaftliche Beiträge wurden auf ihrer Basis veröffentlicht, 970 davon waren begutachtete Publikationen. Die Forschungsdatenzentren sind verpflichtet, ihre Daten sicher, gut zugänglich und zugleich datenschutzkonform zu speichern und zu verwalten. Evaluiert und akkreditiert werden die Zentren vom Rat für Sozial- und Wirtschaftsdaten. Ihm gehören neben Wissenschaftlern auch Vertreter der statistischen Ämter, der Sozialversicherungen, des Robert-Koch-Instituts und der Bundesarbeitsagentur an. Das zwanzigköpfige Gremium berät die Regierungen des Bundes und der Länder beim Ausbau der Forschungsdateninfrastruktur für die Sozial-, Wirtschafts- und Verhaltenswissenschaften. Das Interesse der Politik an einer umfassenden Nutzung der hier gelagerten Datenschätze ist groß, denn sie liefern wichtige Entscheidungsgrundlagen.

          Wissenschaftspolitiker, Drittmittelgeber und Fachgesellschaften wollen die Mehrfachverwertung von Forschungsdaten noch viel stärker als bisher in der Wissenschaftslandschaft verankern. So erwartet die DFG mittlerweile von Wissenschaftlern, die Forschungsgelder beantragen, dass sie ihre Daten wann immer möglich der Sekundäranalyse zur Verfügung stellen. Wer das nicht will, muss es begründen. Langfristig läuft diese Politik auf eine Umkehrung früherer Prioritäten hinaus: Die Forschung aus zweiter Hand wird zur Norm, während neue Erhebungen nur noch dann stattfinden sollen, wenn nicht schon verwertbare Datensätze irgendwo zur Verfügung stehen. Dabei geht es auch um Geld.

          Die „Akademie für Soziologe“, eine Vereinigung von Sozialwissenschaftlern, die sich die „analytisch-empirische“ Forschung auf die Fahnen geschrieben haben, bringt es auf den Punkt: „Um Forschungsressourcen zu schonen“, heißt es in ihren Richtlinien, sollten „Primärerhebungen“ nur noch dann stattfinden, „wenn die Forschungsziele nicht anders erreichbar sind“.

          Qualitative Gesichtspunkte

          Umstritten ist allerdings die Frage, wann das der Fall ist. Kritische Distanz gegenüber der Ausweitung einer Forschung aus zweiter Hand kommt von Sozialwissenschaftlern, die sich qualitativen Methoden verpflichtet fühlen. Für sie steht der direkte Kontakt mit gesellschaftlichen Gruppen und Milieus im Mittelpunkt, sie gehen mit Aufnahmegerät oder Notizblock in die Siedlungen, Fabriken und Fußballstadien. Nicht Fragebögen, Zahlenkolonnen und Statistiken sind ihr Material, sondern Gesprächsprotokolle, Situationsbeschreibungen, Interviews und Videoaufnahmen.

          F.A.Z.-Newsletter „Coronavirus“

          Die ganze Welt spricht über das Coronavirus. Alle Nachrichten und Analysen über die Ausbreitung und Bekämpfung der Pandemie täglich in Ihrem E-Mail-Postfach.

          Bitte beachten Sie unsere Datenschutzhinweise.

          Wer solche Daten einer Sekundäranalyse unterzieht oder mit anderen Befunden verknüpft, um damit die eigenen Forschungsfragen zu beantworten, reißt sie aus ihrem Kontext. Damit verzerrt er ihre Bedeutung oder schmälert zumindest ihre Aussagekraft, so die Befürchtung qualitativ arbeitender Forscher. Hinzu kommt, dass durch die Offenheit der Beobachtungs- und Gesprächssituationen die persönlichen Befindlichkeiten der Wissenschaftler und ihrer Informanten eine ungleich größere Rolle spielen als in der quantitativen Forschung, wo man durch strukturierte Interviews genau das zu verhindern sucht. Seine Subjektivität kann der Forscher im Aufsatz, den er veröffentlicht, thematisieren, bei der bloßen Speicherung der erhobenen Daten aber bleibt sie verborgen. „Soll man den Forscher mit ins Archiv packen?“, fragt Jörg Strübing, der Methoden der qualitativen Sozialforschung an der Universität Tübingen lehrt.

          Der Soziologe weist noch auf ein anderes Problem hin: Offene Forschungsinterviews datenschutzgerecht zu anonymisieren ist oft schwierig: Geht es zum Beispiel um den Arbeitsplatz oder die Schule, besteht die Gefahr, dass sich aus den Details des Gesprächs die Orte und beteiligten Personen rekonstruieren lassen. Andererseits kann eine konsequente Anonymisierung zur völligen Informationsvernichtung führen. Wenn beispielsweise Gesichter in Videoaufnahmen verpixelt werden, so dass keine Mimik mehr erkennbar ist, sind sie für Interaktionsanalysen wertlos.

          Rasterbilder der Wirklichkeit

          Besonders heikel ist die Datennachnutzung bei Forschungen in Milieus am Rande oder jenseits der Legalität. Hier müssen die Forscher erst einmal Vertrauen zum „Feld“ aufbauen. Das gelingt schwer, wenn sie den Informanten in spe pflichtgemäß mitteilen müssen, dass die Daten später noch von Dritten genutzt werden können. Mittlerweile gibt es Datenzentren wie „Qualiservice“ an der Universität Bremen, die sich mit beträchtlichem Auf-wand um eine forschungsfreundliche und zugleich datenschutzgerechte Kuratierung solcher Dokumente bemühen. Allerdings finden Datennachnutzungen in der qualitativen Forschung bislang ohnehin selten statt, so dass manche Wissenschaftler in diesem Feld finden, dass das Geld für solche Infrastrukturen besser in die Forschung fließen sollte.

          Als Mitglied im Rat für Sozial- und Wirtschaftsdaten hatte Jörg Strübing zunächst beträchtliche Schwierigkeiten, bei der Mehrheit seiner quantitativ arbeitenden Kollegen Verständnis für die skeptische Zurückhaltung des qualitativ orientierten Lagers gegenüber der Datennachnutzung zu erwecken. Diese Verständnislosigkeit geht zurück auf eine alte methodische Spaltung in den Sozialwissenschaften: Für viele quantitativ arbeitende Soziologen ist das, was ihre qualitativ orientierten Kollegen machen, keine echte Wissenschaft, sondern „Feuilleton“. Umgekehrt sehen sie sich dem Vorwurf ausgesetzt, der Illusion naturwissenschaftlicher Exaktheit anzuhängen und darüber den Kontakt zur konkreten gesellschaftlichen Wirklichkeit zu verlieren.

          Ähnliche Kontroversen um die Vor- und Nachteile der Mehrfachverwertung von Daten gibt es auch in der Psychologie, wo experimentelle Laborstudien üblich sind, die viel Zeit verschlingen. Wer darauf verzichtet und sich auf die Analyse bestehender Daten beschränkt, schont nicht nur den Etat seiner Forschungseinrichtung. Er produziert auch schneller die für seine Karriere nötigen Publikationen und überrundet dadurch womöglich seine Kollegen, die eigenständige Untersuchungen durchführen.

          Problematisch wird die Nachnutzung von Daten dann, wenn Forscher sich nur noch darauf stützen und auf eigene Erhebungen verzichten, meint Philipp Yorck Herzberg, Professor für Persönlichkeitspsychologie an der Helmut-Schmidt-Universität Hamburg. Er fürchtet, dass das auf Kosten eigenständiger Forschungsideen und Fragestellungen geht und die Herausbildung eines stromlinienförmigen Forschertyps fördert: „Es gibt mittlerweile Promotionen, die nur auf der Reanalyse von vorhandenen Daten beruhen. Wenn Doktoranden das Handwerkszeug, das Konzipieren und Durchführen eigener Studien, nicht mehr lernen, ist das sehr bedenklich.“

          Weitere Themen

          Topmeldungen

          Nach Wahl Laschets : Söder hat keine Eile in Sachen Kanzlerkandidatur

          Bayerns Ministerpräsident warnt nach dem CDU-Parteitag vor einem „Frühstart“ bei der K-Frage und nennt einen geeigneteren Zeitpunkt. Die Grünen machen klar, dass sie im Wahlkampf trotz Aussichten auf eine Koalition die Unterschiede zur Union betonen wollen.
          Fahndungsfotos um 1971 von Mitgliedern der Baader-Meinhof Gruppe.

          Südlich von Hamburg : Waldarbeiter entdecken mögliches RAF-Depot

          Waldarbeiter haben in Niedersachsen einen ungewöhnlichen Fund gemacht: In einem vergrabenen Fass haben sie mutmaßliche RAF-Schriftstücke und andere verdächtige Gefäße entdeckt. Das Landeskriminalamt untersucht den Fund nun.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.