https://www.faz.net/-gqe-7wdyd

Big Data : Google weiß, wo die Grippe lauert

In den vergangenen Wochen hat sich die Farbe der Deutschlandkarte im Netz von einem hellen Grün (minimale Verbreitung der Grippe) - in verschiedene Orange-Töne (mittlere Verbreitung) gewandelt. In Berlin und Sachsen-Anhalt ist die Lage derzeit offenbar besonders brenzlig, dort könnte bald die höchste Stufe erreicht sein: Rot. Zu diesem Ergebnis kommt der amerikanische Internetkonzern mit seinem Analyse-Projekt „Google Flu Trends“. Bild: F.A.Z.

Milliarden von Suchanfragen gehen jeden Tag bei Google ein. Daraus lässt sich eine ganze Menge lernen. Zum Beispiel, wie sich das Grippevirus verbreitet. Berlin ist als Erstes dran.

          Die Nase trieft, der Hals kratzt - in solchen Momenten gehen viele nicht mehr zuerst in die Apotheke, sondern gemütlich zu Hause ins Internet. „Hausmittel gegen Erkältungen“ googeln die Leute dann. Oder: „Mittel gegen Grippe“. Immer häufiger steht eine Google-Suche am Anfang der Therapie. Nicht umsonst schnellen jedes Jahr im November die Suchanfragen zur Grippe in die Höhe. Niemand weiß das besser als Google. Jeden Tag prasseln 3,5 Milliarden Suchanfragen aus der ganzen Welt auf den Internetkonzern ein. Gut für den Nutzer, der Antworten findet, wertlos für die Gesellschaft - so war das lange Zeit.

          Corinna Budras

          Redakteurin in der Wirtschaft und für Frankfurter Allgemeine Einspruch.

          Nun lässt ein amerikanischer Internetkonzern wie Google nicht gerne irgendwelche Datenhaufen ungenutzt herumliegen. Mit Informationen, die Menschen freiwillig über ihre Befindlichkeiten im Internet preisgeben, kennt sich das Unternehmen bestens aus. Die Suchanfragen seiner Nutzer analysiert es emsig; mit maßgeschneiderter Werbung verdient es Milliarden.

          Deshalb dauerte es nicht lange, bis Mitarbeiter im Silicon Valley auf eine simple Idee kamen: Wenn viele Menschen auf einmal nach einem Medikament gegen Grippe suchen, gibt das nicht vielleicht einen Hinweis darauf, dass eine Grippewelle im Anmarsch ist? Und könnte man dann nicht viel schneller als bisher die Behörden warnen? Um Notfallpläne zu erstellen, Impfstoff heranzuschaffen oder Medikamente? Um Krankenhäuser vorzuwarnen und Ärzte?

          Denn nur wenig ist für Menschen und die Wirtschaft so belastend wie eine ordentliche Grippewelle. Wie die vor zwei Jahren zum Beispiel: Es war kurz vor Weihnachten 2012, als die Influenza über Deutschland hereinbrach. In den darauffolgenden Wochen mussten sich rund 4,3 Millionen Menschen wegen Grippe krankschreiben lassen, 32 000 wurden so schwer krank, dass sie ins Krankenhaus eingeliefert wurden. Ende Februar 2013 erreichte die Welle ihren Höhepunkt, doch erst Mitte April, nach qualvollen 18 Wochen, war der Schrecken vorüber. Solche Grippewellen sind nicht nur schmerzhaft, sondern teuer. Schätzungen über den volkswirtschaftlichen Schaden belaufen sich auf bis zu drei Milliarden Euro im Jahr.

          Für „Google Flu Trends“ werden Sucheingaben in 29 Ländern analysiert

          Patienten, Ärzte und Gesundheitsbehörden würden einiges darum geben, wenn sie verlässlich und in Echtzeit wüssten, was geschieht. Und nicht erst zwei oder drei Wochen später, wenn die Behörden ihre Daten mühsam zusammengetragen und die Informationen sortiert haben. Google würde nur allzu gerne in diese Lücke stoßen.

          Mit dem Projekt „Google Flu Trends“ ist der Konzern nun zumindest auf dem Weg dorthin. In 29 Ländern analysiert Google inzwischen die Sucheingaben, um für die Öffentlichkeit ein möglichst akkurates Bild von der Grippeverbreitung zu zeichnen. Die Ergebnisse stellt es auf der Internetseite www.google.org/flutrends zusammen. Eine Karte zeigt in vier Hauptstufen (minimal, niedrig, mittel und hoch) und zahlreichen Unterstufen die aktuelle Grippeverbreitung. Nach dem derzeitigen Stand bewegt sich Deutschland noch ausschließlich im Bereich niedriger oder mittlerer Grippehäufigkeit, was sich auf der Google-Karte im Internet in unterschiedlichen Gelb- und Orangetönen niederschlägt. Doch vor allem die Berliner sollten sich warm anziehen: Dort könnte die höchste Kategorie bald erreicht sein. Das kleine Saarland dagegen scheint besonders widerstandsfähig zu sein.

          Wie kommt Google zu diesen Ergebnissen? Die Antwort dürften viele in Deutschland nicht gern hören: Hinter dem System steckt eine ausgeklügelte Nutzung von Big Data. Ausgerechnet Big Data, das neue Schreckgespenst der digitalen Bedrohung! Das für viele nichts weniger ist als die Rundumüberwachung alles Privaten, aus der es kein Entrinnen mehr gibt. Und tatsächlich sollte jeder wissen, was mit den Informationen geschieht, die er ins weltweite Internet versendet.

          Doch wissen sollte man auch, welchen Nutzen Big Data bringen kann. Denn hinter dem Begriff versteckt sich nichts anderes als eine unvorstellbar große Datenmenge: Allein Google sammelt pro Tag so viele Informationen, dass sie die berühmte Bibliothek des amerikanischen Kongresses füllen könnten - und das rund tausendmal. Als es die technischen Möglichkeiten für deren Auswertung noch nicht gab, ließ man diese Datenmengen links liegen. Heute gibt es die Möglichkeiten zur Auswertung. Damit steht die Gesellschaft vor einer delikaten Frage: Was machen wir mit den Daten? Heben wir diesen Schatz, oder versenken wir ihn, weil seine Nutzung tiefe Eingriffe in die Privatsphäre zur Folge hätte?

          Die hitzige Diskussion ist bereits im Gange: „Big Data kann Leben retten“, schreibt etwa der Jurist Viktor Mayer-Schönberger in dem Buch „Big Data. Die Revolution, die unser Leben verändern wird“, das er zusammen mit dem Journalisten Kenneth Cukier geschrieben hat. Leichtsinn kann man ihm in der Diskussion um Big Data nicht vorwerfen: Schon früh, lange vor den meisten, hat er sich um den Datenschutz im Internet Sorgen gemacht. Er gilt als der geistige Vater dessen, was unter dem Stichwort „Recht auf Vergessenwerden“ den Europäischen Gerichtshof zu einem Grundsatzurteil veranlasst hat. Für ihn ist Big Data vor allem eins: eine der größten Chancen unserer Zeit. Zumindest, solange sie verantwortlich genutzt wird.

          Google sichert zu, die Daten anonym auszuwerten

          Die Münchner Computerunternehmerin Yvonne Hofstetter, als Big-Data-Anbieterin vom Fach, fürchtet das blanke Gegenteil: „Kann Software töten?“ fragt sie in ihrem Buch „Sie wissen alles“. Hofstetter warnt davor, dass wir die Datenflut schlicht nicht mehr beherrschen können. Und nicht wissen, was damit geschieht.

          Bei der Vorhersage der Grippewelle bereitet der Datenschutz allerdings keine allzu großen Probleme, weil jede Anfrage für sich genommen keine Rolle spielt: Nur die regionale Zuordnung ist für die Analyse bedeutsam, Google sichert zu, die Daten anonym auszuwerten.

          Zudem ist der mächtige Konzern nicht das einzige Unternehmen, das auf Big Data setzt. Gerade in der Gesundheitsvorsorge versuchen mittlerweile auch Behörden, sich die Vorteile der Datenmengen zunutze zu machen. Das des Datenmissbrauchs unverdächtige Robert-Koch-Institut versucht etwa mit dem Projekt Grippeweb, Menschen dazu zu bewegen, online und anonym Auskunft über ihren Gesundheitszustand zu geben, damit die Verbreitung der Grippe sinnvoll nachvollzogen werden kann. Bisher machen allerdings gerade einmal 5000 Menschen mit - ein winziger Bruchteil der Nutzer, die Google erreichen kann.

          Mit Big Data allein ist es nicht getan

          Außerdem liefern rund 700 Arztpraxen dem Institut jede Woche Informationen darüber, wie viele Menschen mit Lungenentzündung, Bronchitis und Rachenentzündung in ihren Wartezimmern sitzen. Auf dieser Basis veröffentlicht auch das Robert-Koch-Institut jede Woche eine Deutschlandkarte zum aktuellen Stand der Verbreitung der Atemwegserkrankungen. Zusätzlich werden die Daten ausgewertet, die Ärzte zu den meldepflichtigen Krankheiten liefern, auch zur Grippe. Hinzu kommen die Abstriche aus den Praxen, die konkrete Informationen über das Virus geben. Das alles ist nichts anderes als Big Data, mühselig zusammengesucht zum Nutzen der Gesellschaft.

          Die wichtigste Frage zu Google Flu Trends ist eine andere: Funktioniert das Projekt eigentlich zuverlässig? Daran gibt es auch Zweifel, seit es vor sechs Jahren erstmals vorgestellt wurde. Dabei ist die Grundidee simpel: Menschen, die im Internet nach Medikamenten für Husten und Schnupfen suchen, sind meistens selbst krank. Sobald sich in einer Region solche Suchanfragen häufen, sollten deshalb die Alarmanlagen anspringen.

          Tatsächlich ist die Praxis jedoch viel komplizierter. Denn mit Big Data allein ist es noch nicht getan: Damit die Daten auch etwas über die Wirklichkeit verraten, müssen sie richtig genutzt werden. Dafür begann Google zunächst einmal damit, die historischen Informationen der amerikanischen Seuchenschutzbehörde Centers for Disease Control (CDC) der vergangenen fünf Jahre auszuwerten und mit den eigenen Suchanfragen abzugleichen: Dazu verglichen sie in Amerika die 50 Millionen am häufigsten eingegebenen Suchbegriffe mit den realen Krankheitsdaten der CDC. Welche Begriffe zeigten eine Korrelation mit dem Verlauf der Grippe? 45 wurden ausgewählt, bei ihnen zeigte sich im Rückblick die größte Übereinstimmung mit den historischen Daten.

          Es gibt auch Fehlprognosen

          Als das Projekt im Jahr 2008 startete, war der Erfolg zunächst überragend: Zwei Wochen früher als die Gesundheitsbehörden sagte Google den Verlauf der Grippewelle voraus. Und das auch noch erstaunlich akkurat. Anlässlich der Schweinegrippen-Pandemie im Jahr 2009 überarbeitete Google das System erstmals, um künftig auch für außergewöhnliche Verläufe gewappnet zu sein.

          Das ging eine ganze Weile lang gut. Doch dann kam die Grippesaison 2012/2013, und zum ersten Mal wurden grobe Fehler sichtbar, zumindest in den Vereinigten Staaten. Die Einschätzung von Google Flu Trends erwies sich im Nachhinein als viel zu übertrieben. Die Grippe verbreitete sich wesentlich gedämpfter, als von der Internetseite behauptet, wie eine Analyse von vier amerikanischen Wissenschaftlern ergab: Der einst hochgejubelte Algorithmus schätze die Zahl der Grippehäufigkeit teilweise doppelt so hoch ein wie später die CDC-Zahlen.

          Wie konnte Google in den Vereinigten Staaten so falsch liegen? Viel spricht dafür, dass der eigene Erfindergeist dem Unternehmen bei einem seiner Herzensprojekte ein Schnippchen geschlagen hat: Mit der neuen Funktion „Autocomplete“ lieferte das Unternehmen seinen Nutzern einen wertvollen Service: die automatische Vervollständigung von einzelnen Buchstaben zu ganzen Wörtern. Seitdem muss man sich um die richtige Schreibweise der Suchwörter nicht mehr kümmern. Allerdings könnte das auch dazu geführt haben, dass Signalworte wie Grippe oder Fieber weit häufiger auftauchten als vom Nutzer eigentlich gewollt.

          Eine Sternstunde für Skeptiker: Endlich hatte man eine wissenschaftliche Grundlage für die Ablehnung von Googles unbekümmertem Ausflug in die Grippebekämpfung. Ein Feld, das besser Behörden und Gesundheitsinstituten vorbehalten bleiben sollte. Genüsslich warnten Wissenschaftler davor, die Chancen von Big Data zu überschätzen. Bisher sei es nur ein Hoffnungswert, nichts weiter. Viel zu ungenau sei die Methode.

          Auch Medienberichte können das Interesse der Nutzer hervorrufen

          Auch beim Robert-Koch-Institut ist man in dieser Frage gespalten. Einerseits heißt es kritisch, Google messe nicht die Verbreitung der Krankheit selbst, sondern nur die öffentliche Aufmerksamkeit. Schließlich können auch Medienberichte über eine Grippeepidemie das Interesse der Nutzer hervorrufen. Andererseits zeigen sich die Wissenschaftler auch beeindruckt. Zum Beispiel der Biologe Dirk Brockmann, Mitarbeiter beim Robert-Koch-Institut und gleichzeitig Biologie-Professor an der Humboldt-Universität: „Das Prinzip ist genial“, sagt er. Und dass es in der ersten Generation noch nicht hundertprozentig funktioniere, sei nichts Ungewöhnliches. „In der Wissenschaft muss man Mut haben“, sagt er.

          Tatsächlich ist die sinnvolle Nutzung von Big Data sehr komplex. Nicht umsonst ändert Google mitunter mehrmals am Tag seine Algorithmen, um das beste Suchmaschinenergebnis anbieten zu können. Die Grundlage muss ständig verbessert und an neue Gegebenheiten angepasst werden, sonst hat die Auswertung wenig Sinn. Für das Kerngeschäft wendet Google mit Leichtigkeit die notwendigen Ressourcen für diese endlose Arbeit auf. Das Unternehmen beschäftigt schon seit Jahren eine ganze Reihe auf Algorithmen spezialisierte Analysten.

          Doch mit einem kostenlosen Service im Dienste der Öffentlichkeit lässt sich nun einmal kein Geld verdienen. Deshalb bekommt Google Flu Trends nicht einmal annähernd die Aufmerksamkeit, die die Suchmaschine erhält, der Goldesel des Unternehmens. Das System wird einmal im Jahr überprüft und bisher nur selten überarbeitet, zuletzt Ende Oktober.

          Welche 45 Begriffe Google in seine Analyse einfließen lässt, bleibt geheim

          Damit reagierte der Konzern auf die Welle von Kritik, die wegen der Abweichungen im vergangenen Frühjahr auf ihn eingestürmt war. Zu den großen Änderungen gehört, dass nun aktuelle Daten des amerikanischen Gesundheitsinstituts CDC in den komplizierten Algorithmus eingepflegt werden, hieß es bei der Bekanntgabe der Reform. Daraufhin stellte die „New York Times“ genüsslich fest: Die Lösung für die Probleme von Big Data seien nun traditionelle Daten.

          Ob nun das neue System die hohen Erwartungen erfüllen wird, muss sich in der aktuellen Grippesaison erst noch erweisen. Ähnlich wie bei seiner Suchmaschine weigert sich Google beharrlich, die Details seines Algorithmus offenzulegen. Das Unternehmen veröffentlicht bisher noch nicht einmal, welche 45 Begriffe es in seine Analyse einfließen lässt - sehr zum Ärger der interessierten Öffentlichkeit.

          Unterschätzen sollte man die Chancen von Big Data deshalb noch lange nicht. Der Jurist Viktor Mayer-Schönberger sieht den Charme der neuen Möglichkeiten vor allem darin, dass die schiere Masse an Informationen nicht mehr voraussetzt, dass alle Daten exakt sind. Milliarden von Informationen unterschiedlicher Qualität sind in seinen Augen sinnvoller als wenige, sehr akkurate Daten. „Das Beharren auf Exaktheit ist ein Überbleibsel aus dem analogen Zeitalter, als Information etwas Seltenes und Kostbares war“, schreibt Mayer-Schönberger in seinem Buch. Denn was in der Aufregung über Sinn und Unsinn von Big Data häufig vergessen wird: Der traditionelle Weg der Datenerhebung krankte schlicht daran, dass die wenigen Informationen kein vollständiges Bild abgeben konnten - selbst wenn sie penibel erhoben wurden.

          Weitere Themen

          Als die Grenze fiel Video-Seite öffnen

          August 1989 : Als die Grenze fiel

          Die Welt hat lange stillgestanden an der ungarisch-österreichischen Grenze. Bis zum 19. August 1989. Dann, vor 30 Jahren, platzte zwischen Fertörákos und Mörbisch eine Nahtstelle des Eisernen Vorhangs – mit weitreichenden Folgen für die Region und ganz Europa.

          Man nennt es Meinungsfreiheit

          Trump gegen Google : Man nennt es Meinungsfreiheit

          Ohne das Internet wäre Donald Trump wohl nicht amerikanischer Präsident geworden. Jetzt beschwert er sich über politische Ideologisierung bei Google. Aus dem Silicon Valley schallt es zurück.

          Topmeldungen

          Gletscher Okjökull : Das Eis verlässt Island

          Die Gletscherschmelze ist ein eindrückliches Merkmal der Klimaerwärmung: Der einstige Gletscher Okjökull auf Island ist heute keiner mehr. Die isländische Ministerpräsidentin appelliert an die Weltgemeinschaft.
          In einem Gedenkgottesdienst nehmen Angehörige, Freunde und Nachbarn Abschied von dem achtjährigen Jungen

          Nach Frankfurter Gewaltat : Abschied von getötetem Achtjährigen

          Nach der grausamen Tat am Frankfurter Hauptbahnhof haben Angehörige, Freunde und Nachbarn in einem Gedenkgottesdienst Abschied von dem getöteten Jungen genommen. Auch Hessens Ministerpräsident Volker Bouffier war anwesend.
          Angestellte von Google und Youtube beim Gay Pride Festival in San Francisco, Juni 2014

          Trump gegen Google : Man nennt es Meinungsfreiheit

          Ohne das Internet wäre Donald Trump wohl nicht amerikanischer Präsident geworden. Jetzt beschwert er sich über politische Ideologisierung bei Google. Aus dem Silicon Valley schallt es zurück.
          Im Jahr 2016 ist es in Kalkutta zwar noch wuseliger, aber die Anzahl der Läden und Fahrzeuge deuten auf einen Entwicklungsfortschritt hin.

          Wohlstand, Gesundheit, Bildung : Der Welt geht es immer besser

          Kurz bevor er starb, hat der schwedische Arzt Hans Rosling noch ein Buch geschrieben. Es hat eine zutiefst erschütternde These: Der Zustand der Welt verbessert sich, doch keiner bekommt es mit. Woran liegt das?

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.