Gibt es die Replikationskrise? : Wissenschaftliche Irrtümer in Serie
- -Aktualisiert am
Der amerikanische Mathematiker Aubrey Clayton ist überzeugt, die Wissenschaft stecke in einer Replikationskrise. Blick in ein Labor der Quantenforschung Bild: ÖAW/IQOQI.
Experimente lassen sich in den Naturwissenschaften zunehmend oft nicht wiederholen. Woran liegt das?
Gibt es eine Replikationskrise in der Wissenschaft? Im „Merkur“ (Heft 849, Februar 2020) behauptet der amerikanische Mathematiker Aubrey Clayton, die Welt der Wissenschaft zerbreche sich derzeit den Kopf darüber, warum so viele Studienergebnisse „in Astronomie bis Zoologie“ nicht reproduzierbar seien. Bisher hätten nur einige Wissenschaftler darin einen Anlass gesehen, potentiell alle bisherigen Forschungsarbeiten in Frage zu stellen, doch von einer wissenschaftlichen Replikationskrise „in großem Maßstab“ ist Clayton überzeugt.
Auch Holger Spamann, Rechtswissenschaftler in Harvard und derzeit Fellow am Berliner Wissenschaftskolleg, sprach kürzlich in einem Vortrag unter Berufung auf Studien wie das „Social Science Replication Project“ von einem „schockierend hohen Anteil“ empirischer Ergebnisse, die nicht replizierbar „und daher vermutlich schlicht falsch“ seien. Seit 2012 habe es jedenfalls in der Psychologie geradezu eine Welle von systematischen Replikationsstudien gegeben, aber auch ähnliche Studien aus der Krebsforschung zeigten, dass wir es hier nicht nur mit einem Problem der Sozialwissenschaften zu tun hätten, so Spamann.
Dessen Harvard-Kollege Steven Shapin schreibt in der „Los Angeles Review of Books“ unterdessen, es wäre ja geradezu „pervers“, die aktuelle „Krise der wissenschaftlichen Wahrheit“ zu leugnen. Aber bedeuten Replikationsprobleme wirklich schon eine veritable Krise?
Eine Krise der Seriosität
Natürlich war es im Frühjahr 1989 nur eine Frage von Wochen, bis weltweit Forscherteams fieberhaft versuchten, das sensationelle Experiment von Fleischmann und Pons zum Nachweis der kalten Fusion nicht nur zu wiederholen, sondern zum gleichen positiven Ergebnis zu kommen. Bekanntlich war all diesen Replikationsversuchen kein Erfolg beschieden. Die Beispiele, die Clayton zur Illustration seiner Krisendiagnose heranzieht, entstammen anderen Niederungen wissenschaftlicher Kreativität. Beanstandet wird beispielsweise das Experiment des kanadischen Psychologen Ara Norenzayan, der 2012 zwei Gruppen von Studenten wahlweise auf Rodins Skulptur „Der Denker“ sowie den antiken Diskuswerfer von Myron starren ließ, um daraus zu schlussfolgern, dass der Anblick von Rodins Werk den Atheismus fördere.
Man könnte bei der immerhin in „Science“ erschienenen Studie auch einfach fragen, welchen wissenschaftlichen Wert solch ein Unfug überhaupt hat – und damit in der Replikationskrise eher eine Krise der Seriosität so mancher publizierten Forschung vermuten. Im Vergleich etwa zur Arzneimittelentwicklung mit ihren strikten Regularien zur Replizierbarkeit klinischer Forschung mangelt es in den Sozialwissenschaften schlicht an den institutionellen Anreizen, die Befunde der lieben Kollegen unter die Lupe zu nehmen.
Es sei denn, man ist einem spektakulären Plagiatsfall auf der Spur. Doch generell stünden replizierende Kollegen rasch im Verdacht, mangels eigener Ideen nur an den Funden der anderen herummäkeln zu können, so Spamann aus eigener Erfahrung. Reputationsgewinne lassen sich so jedenfalls nicht einstreichen. Die Wissenschaft prämiert das Neue, nicht das Bestätigen von Altem.
Strengere statistische Verfahren könnten Abhilfe schaffen
Experimente wie die von Norenzayan zu replizieren erscheint eigentlich noch sinnloser, als sie überhaupt zu veranstalten. Vermutlich werden jährlich weltweit Abertausende von wissenschaftlichen Studien publiziert, die in diese Rubrik fallen. Man wird also keinesfalls von einer Krise der Wissenschaft sprechen können, was auch Spamann am Wissenschaftskolleg betonte. Oder wie es Shapin ausdrückt: Die Suche nach reproduzierbaren wissenschaftlichen Fakten und Naturgesetzen mag für Fächer wie Kernphysik, Astronomie oder Hirnforschung sozusagen der Goldstandard der Forschung sein. Aber nicht für Seismologie, Politikwissenschaft oder gar die Forschung auf dem Gebiet der Softdrinkherstellung. Man müsste erst einmal fragen, was von wissenschaftlichen Disziplinen im Einzelnen erwartet wird – und was nicht. Materialforschung, die darüber entscheidet, wie Talsperren oder Atomkraftwerke gebaut werden müssen, hat anders zu arbeiten als Forschung, die sich mit dem Anstarren von Skulpturen beschäftigt.
Man sollte die angebliche Krise der Wissenschaft also zutreffender als ein Replikationsproblem einzelner Fächer bezeichnen und sich dann Gedanken machen, welche institutionellen Maßnahmen dem entgegenwirken könnten. Clayton sieht wie Spamann einen Grund in der Verwendung des heute vorherrschenden Standardansatzes zur Beurteilung wissenschaftlicher Hypothesen: die sogenannte Signifikanzprüfung. Sie bringe viel zu viele „positiv falsche“ Ergebnisse hervor, es mangele ihr an Strenge und außerdem suggeriere sie signifikante und publikationswürdige Zusammenhänge, wo es sich bestenfalls um interessante Auffälligkeiten handele. Strengere statistische Verfahren könnten hier Abhilfe schaffen. Generell bräuchte es aber ein viel größeres öffentliches Interesse an Replikationsstudien, klagte Spamann, darauf spezialisierte Journals und Auszeichnungen für gelungene Arbeiten auf diesem Gebiet.
Natürlich ist die Replikationskrise auch eine Wachstumskrise. Schließlich ist jede wissenschaftliche Veröffentlichung das Ergebnis eines Projektes, also eines entsprechenden Forschungsantrages. Und sollten Publikationen nicht zunächst durch kritische Peer-Review-Verfahren gegangen sein? Würden Gutachter ihre Arbeit machen, also deutlich höhere Ablehnungsquoten durchsetzen, dann verlöre auch das Problem der Replikation an Relevanz.