Wissenschaft und Daten : Forschung aus zweiter Hand
- -Aktualisiert am
Speichermedien werden für die Wissenschaft immer wichtiger Bild: Prisma Bildagentur
Wissenschaft mit fertigen Datensätzen breitet sich rasant aus. Sie entzweit die Lager. Für manche Studien ist sie unabdingbar, doch sie kann auch den Blick auf die Wirklichkeit verzerren.
In Marienthal, einem Dorf in der Nähe Wiens, wurde 1931 fast die gesamte Bevölkerung arbeitslos, weil die ortsansässige Textilfabrik schließen musste. Was für die Einwohner eine Katastrophe war, wurde für die Sozialwissenschaft zur Sternstunde. Unter der Leitung von Paul Lazarsfeld und Marie Jahoda protokollierte ein Soziologenteam mehrere Monate lang minutiös, wie die Arbeitslosigkeit das Dorfleben prägte, die Gewohnheiten der Bewohner änderte und auf ihre Psyche einwirkte.
„Die Arbeitslosen von Marienthal“ ist eine Studie, die mit ihrer Kombination aus unmittelbarer Beobachtung und penibler Datenerhebung als Klassiker der empirischen Sozialforschung gilt. Auch heute gibt es noch Soziologen, die in dieser Tradition arbeiten. Aber viele forschen mittlerweile vor allem am Schreibtisch und vor dem Bildschirm: Sie konzipieren Untersuchungen, definieren Stichproben, entwerfen Fragebögen und werten die eingehenden Daten aus.
Den unmittelbaren Kontakt zu den „Beforschten“ haben hingegen meistens freiberuflich tätige Interviewer, die anhand standardisierter Fragebögen Lebensverhältnisse oder Einstellungen erfragen. Und oft ist die Distanz der Wissenschaftler zu den Lebenswelten, die sie erforschen, sogar noch größer. Immer mehr Sozialwissenschaftler werten für ihre Studien Daten aus, die nicht sie selbst erhoben haben, sondern Kollegen vor ihnen.
Replizierbarkeit von Studien
Diese „Nachnutzung“ ist nicht nur in der Soziologie, sondern auch in den Wirtschaftswissenschaften, der Psychologie und den Erziehungswissenschaften mittlerweile weit verbreitet. Dafür gibt es gute Gründe, sagt der Wirtschaftswissenschaftler Gert G. Wagner vom Max-Planck-Institut für Bildungsforschung. „Datennachnutzungen sind sinnvoll, weil man Daten zur Vergangenheit nicht im Nachhinein erheben kann. Die Nachnutzung bereits erhobener Daten ermöglicht aktuelle Längsschnittuntersuchungen über Lebensläufe hinweg.“
Ein Beispiel sind die großangelegten Studien des Sozio-oekonomischen Panels (SOEP), dessen Chef Wagner viele Jahre lang war. Sie untersuchen, wie soziale und wirtschaftliche Verhältnisse, Arbeitsbedingungen oder der Zugang zu Bildung Lebensläufe prägen. Gerade gestartet ist eine Studie mit 34 000 Teilnehmern, in deren Verlauf Wissenschaftler des SOEP und des Robert-Koch-Instituts (RKI) über mehrere Jahre hinweg die medizinischen und sozialen Auswirkungen der Corona-Pandemie untersuchen werden.
Eine günstige Bedingung dafür, dass sich einmal erhobene Forschungsdaten zu späteren Zeitpunkten und auch unter verschiedenen thematischen Perspektiven erneut analysieren lassen, ist die Standardisierung der Fragen und möglichen Antworten. Das ist in der quantitativen Sozialforschung die Norm. Den methodischen Kern ihrer Projekte bilden die statistische Repräsentativität und die Orientierung am Ideal der Naturwissenschaften. Die Untersuchungsbedingungen sollen genau definiert und die Forschungsergebnisse replizierbar sein.
Solche Replikationen sind ein wichtiger Anwendungsbereich der Datennachnutzung. In den vergangenen Jahren deckten Kontrollanalysen in einer Reihe bereits publizierter Arbeiten aus der Soziologie und der Psychologie gravierende Mängel bei der Erhebung oder Auswertung der Daten auf. Renommierte Journale wie die „Zeitschrift für Soziologie“ verlangen mittlerweile von ihren Autoren, ihre quantitativen Daten auf einem Replikationsserver zugänglich zu machen.