http://www.faz.net/-gwz-7ng8s
HERAUSGEGEBEN VON WERNER D'INKA, JÜRGEN KAUBE, BERTHOLD KOHLER, HOLGER STELTZNER
F+ Icon
F.A.Z. PLUS
abonnieren

Veröffentlicht: 17.03.2014, 21:20 Uhr

Googles Grippeflop Schmutzige Daten

Googles Versuch, Grippewellen vorherzusagen, ist gescheitert - gleich zwei Mal hintereinander. Big Data kommt an Grenzen. Und zwar nicht nur in diesem Fall. Man hätte es ahnen können: Die Fehler im System liegen auf der Hand.

von
© dpa Big Data im kleinen Stil: Die elektronische Gesundheitskarte

Es gibt keine Daten ohne eine Theorie.“ Vermutlich war Albert Einstein, als er diesen bedenkenswerten Satz geprägt hat, nicht ganz frei von eigenen Interessen. Und natürlich war das vor allem eine gemeine Stichelei gegen die Kollegen an der Experimentier- und Beobachtungsfront, die für ihn mehr oder weniger blind Galileos Programm umsetzten, nämlich alles zu messen, was messbar ist.

Joachim  Müller-Jung Folgen:

Inzwischen bekommt sein Wort allerdings zusehends Gewicht, und zwar im buchstäblichen Sinn. Denn jetzt, drei Generationen und Dutzende Computerrevolutionen später, hat sich mit „Big Data“ ein Paradigma etabliert, das nicht mehr und nicht weniger als die Anleitung zum intelligenten Leben gesehen wird. Sät Instrumente und ihr werden wertvolle Informationen sammeln, Modelle füttern und Kristallkugeln ernten. Daten sind zum Fetisch geworden. Gegen Big Data ist der Wetterdienst eine alte Postkutsche. Google hat das vorgemacht. Der Google Flu Tracker soll ein Beispiel dafür sein, wie Big Data die Welt entschlüsselt und vermeintlich berechenbar macht.

Die infizierte Datenflut

Allein aus der Häufung von ein paar Dutzend Suchwörtern wie Fieber oder Husten in der Google-Maske will das Unternehmen die Ausbreitung der jährlichen Grippewelle voraussagen. Das Dumme bloß: Es funktioniert nicht. In den letzten beiden Saisons hat die Datendreschmaschine das Auftreten der Influenza um insgesamt 50 Prozent überschätzt, in hundert von hundertacht Wochen hat sie die Zahl der Grippekranken zu hoch eingeschätzt. Eine simple Hochrechnung aus den lückenhaften Grippe-Daten der Gesundheitsämter, die zwei Wochen zurückreichen, schneidet besser ab. Die Gründe dafür sind so einfach wie logisch: Big Data selbst ist krank. Die Datenkolosse sind selbst infiziert, wie David Lazer aus Boston und einige Kollegen in „Science“ dargelegt haben.

Alles hängt von der Validität der Daten, der Qualität der Messung und dem ab, was die Forscher „Abhängigkeiten“ nennen. Gemeint ist, dass Google kommerzielle Interessen verfolgt. Schon das erzeugt ein fatales Datenrauschen. Algorithmen sind auf die fragilen Bedürfnisse der Kunden angepasst und nicht etwa der Wahrheit auf der Spur. Entsprechend werden sie laufend verändert. Und geheim gehalten werden die Algorithmen sowieso. Big Data ist also infiziert von unsauberen Daten und kryptischen Modellen.

Wer glaubt, dass das nur für Datengrossisten wie Google gilt, konnte sich auf der Cebit belehren lassen: Big Data ist generell vom Big-Business-Virus befallen. Das dürfte bald für den gesamten Gesundheitssektor gelten. Im Grunde also weiter wie bisher. Ob sich das Datengeschäft im großen Stil dann irgendwann auch für den Patienten mit großer Münze auszahlt, ist erstmal reine Spekulation. Eine solide Theorie kann man das nicht nennen.

Mehr zum Thema

Zur Homepage