http://www.faz.net/-gwz-80ftj

„Nichts als die Wahrheit“ : Google-Suchmaschine setzt auf Fakten

Die Suchmaschine Google Bild: dpa

Runter mit Verschwörungen und Pseudowissen: Wer künftig bei Google sucht, soll vertrauenswürdige Seiten zuerst finden. 119 Millionen Adressen haben schon bestanden, viele populäre Seiten fallen durch.

          Wer Unsinn im Netz verzapft, und sei es nur, um einen Twittersturm zu erzeugen oder Klickzahlen zu generieren, der darf bald nicht mehr auf die Mithilfe von Google hoffen. In Suchanfragen soll Pseudowissen grundsätzlich nicht mehr auf den vorderen Seiten landen. Denn Google ändert in seinem Suchalgorithmus entscheidende Qualitätskriterien. Das haben Software-Ingenieure des Konzerns in einem wissenschaftlichen Aufsatz mitgeteilt. Vertrauenswürdigkeit soll der Maßstab sein, wie es heißt, „wissensbasierte Vertrauenswürdigkeit“. Fakten statt Klicks. Die  Pole-Position im Suchergebnis soll die Wahrheit bekommen, weniger der Populismus. Oder, im Google-Sprech: „Nichts als die Wahrheit“. 

          Joachim  Müller-Jung

          Redakteur im Feuilleton, zuständig für das Ressort „Natur und Wissenschaft“.

          Der Anspruch kommt nicht ganz plötzlich. Schon im vergangenen Jahr hatten Google-Forscher angekündigt, mit „Knowledge Vault“ die weltgrößte Datenbank aufzubauen, in der gesicherte Fakten über die Welt gespeichert sind. Wer etwas über die Welt wissen möchte und bei Google eine Suchanfrage eintippt, soll an erster Stelle eine möglichst richtige Antwort erhalten. Zwischen den Zeilen der Veröffentlichung war schon damals die Furcht zu lesen, zum Handlanger von Verschwörungstheoretikern und zur unseriösen Plattform für wilde Gerüchte zu werden. Texte, in denen Falsches steht – etwa, dass Barack Obama gar kein amerikanischer Staatsbürger sei –  will man in der Ergebnisliste weit hinten sehen;  auch wenn solche Texte millionenfach gelesen und per Link weiter verbreitet werden.

          Im Kern geht es darum, vom rein populistischen auf einen  wissenschaftlichen, enzyklopädischen Ansatz zu wechseln. Innerhalb eines halben Jahres hat Google die KV-Datenbank um mehr als 75 Prozent erweitert, mittlerweile sind zwei Milliarden Webseiten gelistet, die mit einem automatisierten Verfahren auf ihre „Vertrauenswürdigkeit“ – trustworthiness – geprüft wurden. Wie aber stellt Google fest, welche Informationen vertrauenswürdig sind? „Eine Quelle, die wenige falsche Fakten enthält, wird als vertrauenswürdig eingestuft”, heißt es dazu in der Veröffentlichung.

          Die Google-Suche: Bürger können auch verlangen, dass Links aus den Ergebnislisten gelöscht werden.
          Die Google-Suche: Bürger können auch verlangen, dass Links aus den Ergebnislisten gelöscht werden. : Bild: Reuters

          Nun ist Faktenwissen freilich nicht immer klar als falsch oder richtig einzustufen. Auch die Wissenschaft muss andauernd neu differenzieren. Häufig kommt es darauf an, wie man fragt oder was man wie und wann betrachtet. Die Frage etwa, ob das Foto eines ziemlich billigen Kleides, das in den  vergangenen Tagen unter Schlagworten wie #dressgate oder #TheDress weltweit berühmt wurde, nun als blau und schwarz oder weiß und gold wahrgenommen wird, ließe sich mit der KV-Google-Datenbank nicht beantworten. Am schnellsten hätte man noch erfahren, dass die Besitzerin des Kleides und Urheberin des Hype-Fotos eindeutig ein schwarz-blaues Kleid gekauft hatte. Warum viele, die Besitzerin eingeschlossen, dennoch auf dem Schnappschuss ein weiß-goldenes Kleid sehen, würde sich kaum klären lassen. Noch ließe sich das Gegenteil der eigenen Wahrnehmung empirisch beweisen. Nicht jede optische Illusionen lässt sich schlüssig und endgültig klären, wenn man nicht den individuelle Kontext der Wahrnehmung berücksichtigt – sprich: Jede Person ist anders.

          Welche Wahrheit ist wahrscheinlicher?

          Das ultimative Wissen der Welt gibt es also gar nicht, was inzwischen  philosophisch mit dem „neuen Realismus“ – auch eine Art Hype – mal wieder verstärkt diskutiert wird. Um absolute Wahrheiten soll es im modifizierten Google-Ranking aber auch offenbar gar nicht gehen. Viel eher um das, was wir als Plausibilität kennen, als Ausdruck empirisch gesicherter Informationen. Der neue Algorithmus, „Knowledge-based Trust“ (KBT) rechnet deshalb mit Wahrscheinlichkeiten. Wie groß ist die Wahrscheinlichkeit, dass die Daten stimmen, dass die Werte richtig sind oder das behauptete Faktum stimmt.

          Informationstechnisch gesehen geht es also um erweiterte Wahrscheinlichkeitsrechnungen, um Statistiken, die gewaltige Datenmengen intelligent zusammenführen und einstufen. Im Prinzip nutzt die Suchmaschine dazu viele schon bekannte Softwares und Apps,  die für den Fakten- und Datencheck eingesetzt werden können. „FactCheck.org“  oder „Snopes“ sind Serviceanbieter, die sich solcher Prüfprogramme bedienen. Künftig geht das dann mit KBT so: Geht eine Suchanfrage ein, wird die gigantische Datenbank nach drei Elementen abgefragt, die im engen Zusammenhang mit den Suchbegriffen stehen. Sie sind das „Triple“, gewissermaßen die drei Säulen der Google-Wahrheit, aufgebaut wie die drei elementaren Bestandteile eines deutschen Satzes: Subjekt (um wen oder was geht es), Prädikat (was willst du darüber wissen) und Objekt (was weiß man). Am Beispiel des amerikanischen Präsidenten gezeigt: Obama (Subjekt), Nationalität (Prädikat), Vereinigte Staaten (Objekt). Wenn sich für eine Suchanfrage diese drei Informationen anwenden lassen, gehört sie in jene Kategorie, die künftig nach dem neuen, vermeintlichen Wahrheits-Algorithmus gelistet werden kann.

          Qualität statt Quantität

          Entscheidend für das Ergebnis, die als Wahrscheinlichkeit berechnete Vertrauenswürdigkeit, ist dabei auch der Abgleich der Prüf-Softwares. Google nutzt dazu bisher 16 sogenannnte „Extraktoren“. Sie ziehen die relevanten, seriösen Daten aus dem Pool, Google stellt daraus seine Hierarchie her. Die Suchmaschine bedient sich dabei der eigenen, quasi schon validierten KV- Datenbank und füttert sich ständig selbst mit neuen,  aus dem Internet gewonnen und geprüften Daten.  Die digitale Vision dahinter ist nicht neu. IDM verfolgt mit „Watson“ ganz ähnliche Ziele. Und wenn man so will, wäre es (in der ersten Ausbaustufe?) die Verwirklichung eines utopischen Megacomputers wie „HAL 9000“  in „2001: Odyssee im Weltraum“, der im Prinzip zwar jede Frage nach dem Stand des Wissens genau beantworten kann, allerdings auch nach einem relativ starren Muster vorgeht und in emotionalen, sehr individuellen Fragen durchaus überfordert ist. Trotzdem ist das Vorgehen grundsätzlich anders als das reine Popularitätsranking bisher.

          Google verspricht also nichts weniger, als den Informationsgehalt der Welt künftig zuerst mathematisch nach dem Wahrheitsgehalt zu ranken – nach einem offenbar möglichst neutralen, auf empirischen Fakten basierten System. Qualität statt Quantität. An die Stelle äußerer Merkmale wie der Zahl der Hyperlinks und der Surfgeschichte eines Suchbegriffs treten dann zuerst „endogene Signale“, wie die Wissenschaftler schreiben – die Wertigkeit der Informationen selbst. Die Frage freilich, wie erfolgreich Google künftig Pseudowissen, Gerüchte,  Verschwörungstheorien herausfiltert – wenn auch nicht eliminiert – lässt sich nur im Alltag beantworten.

          Die Pilotstudien dazu haben die Softwareingenieure des Konzerns abgeschlossen. In dem Aufsatz berichten sie über 2,8 Milliarden „Triple“-Anfragen, die auf das Web angewendet wurden. Damit sind demnach die Inhalte von mindestens 119 Millionen Webadressen und zusätzlich 5,6 einzelne Webseiten auf ihre Vertrauenswürdigkeit hin getestet worden. Viele extrem populäre Internetseiten sind durch das Netz von Googles Jägern der verlorenen Wahrheit gerutscht. 14 von 15 bisher top gesetzten Humor-Adressen beispielsweise, allesamt unter den 15 Prozent meistgeklickten amerikanischen Internetseiten, sind quasi komplett durchgefallen und mit Googles KBT-Suchmaschine in die untere Hälfte der Suchanfragen abgerutscht.  Auch Internetforen, in denen sich die besonders schreibwütigen und kommentarfreudigen User austoben, dürften den Google-Forschern zufolge zu den großen Verlierern der Qualitätsoffensive zählen. Die Wahrscheinlichkeit, dass Google damit auch den Trollen das Handwerk legt, geht allerdings gegen Null.

          Quelle: FAZ.NET

          Weitere Themen

          Ich bin's, der Barack Video-Seite öffnen

          Ex-Präsident besucht Schule : Ich bin's, der Barack

          Die Schüler der McKinley Tech High School staunten nicht schlecht, als plötzlich Barack Obama durch die Tür schneite. Der Ex-Präsident sprach mit den Jugendlichen über ihre Ziele und darüber, was sie der Gesellschaft zurückgeben können.

          Topmeldungen

          Konflikt um Unabhängigkeit : Eskalation in Katalonien

          Seit Monaten bereitet Katalonien das Unabhängigkeitsreferendum vor. Madrid will die Abstimmung unbedingt verhindern und greift jetzt durch – mit Festnahmen und Durchsuchungen.

          Erdbeben in Mexiko : Diese Sedimente wackeln wie ein Pudding

          Das Erdbeben in Mexiko hat trotz verschärfter Bauvorschriften verheerende Auswirkungen. Denn Mexiko-Stadt steht auf einem wackeligen Fundament. Und den Menschen blieben nur 15 Sekunden, um ihre Häuser zu verlassen.
          Teilnehmer einer NPD-Kundgebung in Bautzen im Mai 2017.

          Zusammenarbeit mit der NPD : Wie rechts ist Bautzen wirklich?

          Ein stellvertretender CDU-Landrat aus Bautzen hat in Asylfragen mit Neonazis kooperiert – und wird dafür von mehreren lokalen Politikern gelobt. Denn die angespannte Lage in der Stadt hatte sich danach beruhigt.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.