Home
http://www.faz.net/-gsn-72frh
HERAUSGEGEBEN VON WERNER D'INKA, BERTHOLD KOHLER, GÜNTHER NONNENMACHER, FRANK SCHIRRMACHER, HOLGER STELTZNER

Google und die Wissenschaft Nach der Genomik nun die Kulturomik

 ·  Google als Forschungsförderer: Die Herren der Suchmaschine sind selbst auf der Suche nach Verfahren, die mehr Sinn aus ihren riesigen Datenwolken herauszulesen vermögen.

Artikel Bilder (1) Lesermeinungen (0)
© AFP Mit einem weit ausgreifenden Interesse an Zeichenverarbeitung: Dieses von Kindern gestaltete Logo präsentierte der Konzern im Jahr 2011 in seiner Zentrale im kalifornischen Mountain View

An Gott glauben wir - von jedem anderen wollen wir Daten sehen!“ Als Ex-Google-Chef Eric Schmidt im vergangenen Jahr im Bostoner MIT diese Worte sprach, brachte er sein Publikum sogar dazu, ihm sein Credo nachzubeten. Dass allerdings aus der bloßen Anhäufung von Texten, Bildern, Zahlen noch kein Wissen und auch keine Dollars erwachsen, weiß man natürlich genau in einem Unternehmen, das seine Milliarden mit Suchmaschinen verdient, deren ausgetüftelte Algorithmen Inhalte möglichst zielgruppengenau mit Werbeeinblendungen verknüpfen.

Mehrere hundert Forscher - im Firmenjargon „Googler“ genannt - arbeiten im Auftrag des Unternehmens daran, die ideale, die weltumspannende Suchmaschine möglichst bald Wirklichkeit werden zu lassen: Sie soll nicht nur Begriffe, sondern auch komplizierteste Anfragen - mündlich oder schriftlich - in jeder beliebigen Sprache verstehen, sie in alle Sprachen der Welt übersetzen, daraufhin Milliarden von digital verfügbaren Texten, Bildern, Tonaufnahmen und Videos durchsuchen und dem Nutzer in kürzester Zeit eine präzise und umfassende Antwort auf den Bildschirm und in die Kopfhörer schicken - samt den passenden Anzeigen, versteht sich.

Ein weltweites Kontaktnetzwerk

Um diesem Ziel näher zu kommen, nutzen Google-Forscher in starkem Maße statistische Verfahren für die Sprachverarbeitung. Zum Beispiel bei der maschinellen Übersetzung: Statt dem Computer Wörterbücher und komplexe Grammatikregeln einzugeben, wird er mit großen Mengen bereits existierender Texte und deren Übersetzungen - von der Bibel bis zu UN-Dokumenten - gefüttert. Statistische Algorithmen ordnen die Wörter und Sätze aus Quell- und Zieltexten aufgrund von Häufigkeiten einander zu. Schritt für Schritt leitet das Programm daraus die zugrunde liegenden Sprachmuster und Übersetzungsprozeduren ab.

Voraussetzung für dieses maschinelle „learning by doing“ sind riesige maschinenlesbare Textmengen. Wer, wie Google, darüber verfügt, hält einen Schlüssel für die Internet-Zukunft in der Hand. Dabei setzt man im kalifornischen Mountain View nicht nur auf die eigenen Wissenschaftler. Der Konzern, der sich gern wie ein kreativer Campus präsentiert, wo nebenbei auch Geld verdient wird, kooperiert mit zahlreichen Universitäten und sucht den Austausch mit Informatikern und Kognitionswissenschaftlern weltweit. Ein wichtiges Instrument dafür ist die firmeneigene Forschungsförderung.

Ausgeweitete Forschungsförderung

Zu ihr gehören neben Stipendien vor allem Wissenschaftspreise, mit denen Google alljährlich zahlreiche Projekte auszeichnet. Der „Google Focused Research Award“ unterstützt längerfristige Forschungsvorhaben nicht nur mit Geld, sondern auch mit Expertise und technischen Ressourcen. Eine Chance hat allerdings nur, wer von Google aufgefordert wurde, seine Unterlagen einzureichen. Weniger exklusiv ist der zweimal jährlich ausgeschriebene „Google Faculty Research Award“, um den sich jeder Hochschulprofessor bewerben kann. Die bewilligten Summen liegen zwischen 10.000 und 150.000 Dollar. Im zweiten Halbjahr 2012 wurden 104 von 815 eingereichten Projekten ausgewählt und mit insgesamt sechs Millionen Dollar gefördert.

Das Spektrum umfasst neben computerwissenschaftlichen Themen im engeren Sinne (Bilderkennung, Übersetzung, Suchmachinenoptimierung) auch erziehungs-, kultur- und rechtswissenschaftliche Aspekte der digitalen Welt. Nur etwas über ein Viertel der Awards ging an Hochschulen außerhalb der Vereinigten Staaten. Doch dieser Anteil wird sich erhöhen, vermutet Hans Uszkoreit, wissenschaftlicher Direktor am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken und einer der profiliertesten Computerlinguisten in Deutschland. Uszkoreit ist einer von drei deutschen Forschern, die in der aktuellen Ausschreibungsrunde einen „Google Faculty Research Award“ gewonnen haben.

Eine Entscheidung nach wenigen Wochen

Bei seinem mit 75.000 Dollar geförderten Projekt geht es darum, Suchmaschinen „intelligenter“ zu machen, so dass sie komplexere Fragen bearbeiten können, zum Beispiel vom Typ: Wer hat die Person a zum Zeitpunkt b am Ort c getroffen? Gebraucht wird ein Programm, das die Logik solcher Fragen in den sehr unterschiedlichen sprachlichen Verpackungen, in denen sie auftreten können, erkennt und ihnen die passenden Inhalte zuordnet. Hans Uszkoreit ist nicht der erste Google-Preisempfänger am DFKI. Vor zwei Jahren wurde dort ein System zur automatischen Erkennung von Videoinhalten ausgezeichnet, das sich für die Vernetzung mit passender Werbung einsetzen lässt. Und auch das mit dem DFKI kooperierende Max-Planck-Institut für Informatik, ebenfalls in Saarbrücken, erhielt bereits Geld aus Mountain View. Neben der finanziellen Hilfe profitieren Hans Uszkoreit und viele andere Gewinner davon, dass Google ihnen Zugang zu seinen Datensammlungen gewährt.

Wer sich um einen Google-Award bewirbt, bekommt schon nach wenigen Wochen die Entscheidung mitgeteilt. Nach welchen Kriterien die vielen hundert Gutachter, die laut Google mit der Bewertung befasst sind, sein Projekt ausgewählt oder abgelehnt haben, erfährt er allerdings nicht. An die Preisgelder sind keine Bedingungen geknüpft, bis auf eine: Die Forschungsergebnisse sollen frei zugänglich veröffentlicht werden.

„Brain drain“ nach Kalifornien

Auf diese Weise kann Google sich von neuen Ideen inspirieren lassen, ohne mit den Urhebern um Rechte und Honorare verhandeln zu müssen oder Gefahr zu laufen, dass die Konkurrenz das Wissen aufkauft. Mindestens ebenso wichtig ist für Google, auf diese Weise Talente entdecken und einkaufen zu können. Die Förderungs-Millionen - bescheidene Summen, gemessen an Googles Umsätzen - sind also klug investiert.

Die deutsche Forschung rund um die Künstliche Intelligenz bietet dabei ein durchaus interessantes Revier für die Talent-Scouts von Google. Im Bereich der maschinellen Sprachverabeitung, insbesondere der Computerübersetzung, gehören deutsche Informatiker und Linguisten seit den sechziger Jahren zur internationalen Spitze. So ist es kein Zufall, dass mit Franz Josef Och, promoviert an der RWTH Aachen, der Leiter der Google-Forschungsabteilung für maschinelle Übersetzungen aus Deutschland kommt. Auch Hans Uszkoreit wurden schon einige besonders fähige Mitarbeiter nach Mountain View abgeworben - bei Einstiegsgehältern, die das Salär deutscher Professoren übersteigen, lässt sich dieser „brain drain“ kaum verhindern.

Substantielle Finanzhilfe auch für Geisteswissenschaftler

Aber nicht nur das Geld mache die Attraktivität aus, sagt Hans Uszkoreit, der die Google-Verhältnisse aus eigener Anschauung gut kennt, sondern auch die Wertschätzung akademischer Brillanz und ein intellektuelles Umfeld, das Uszkoreit als „ein prickelndes Schaumbad“ beschreibt. Die deutsche Industrie, so seine Erfahrung, betrachtet Wissenschaftler dagegen eher als Zulieferer, nicht als Quelle der Inspiration.

Während Informatik, Mathematik und Computerlinguistik zu den Kerndisziplinen in Googles Daten-Reich gehören, stehen die philologischen und historischen Fächer noch am Rand. Doch auch sie rücken stärker in den Fokus. Zu denen, die von dieser wachsenden Aufmerksamkeit profitieren, gehört der Hamburger Literaturwissenschaftler Jan Christoph Meister. Gemeinsam mit seinem Team hat er eine Software entwickelt, die Philologen dabei hilft, zu analysieren, wie zeitliche Ebenen und Abläufe erzähltechnisch konstruiert werden.

Meister bekam zweimal Geld von Google: einen „Digital Humanities Award“ aus einem 2010 speziell für die Geisteswissenschaften eingerichteten Programm sowie einen „Faculty Research Award“, beide dotiert mit jeweils 50.000 Dollar. Für Meister bedeutet das Google-Geld eine substantielle Hilfe. „In der deutschen Förderlandschaft für ein solches Vorhaben finanzielle Unterstützung zu finden, wäre schwierig gewesen“, meint er. Es passe nicht in das hier übliche Projektschema, und es gebe auch nur wenige kompetente Fachgutachter für solche Grenzbereiche zwischen Informatik und Literaturwissenschaft.

Begeisterung bei vielen Kulturwissenschaftlern

Auch für Meister und sein Team bot neben dem Geld der Zugang zu Daten, in diesem Fall aus dem Google-Books-Korpus, eine wichtige Unterstützung. Anders als dem normalen Nutzer, der diese Texte auf dem Bildschirm nur als eine Kopie der Buchseiten vor sich sieht, benötigen die Forscher die Texte in maschinenlesbarer Form, um sie mit der eigenen Software durcharbeiten zu können.

In den digital orientierten Geisteswissenschaften spielt Google mittlerweile eine zentrale Rolle. Das Unternehmen verfügt nicht nur über die Daten von Millionen digitalisierter Bücher, sondern es stellt mit dem „Google Ngram Viewer“ auch eine Suchmaschine zur Verfügung, die diese Textmassen auf „N-Gramme“ - beliebige Buchstaben-, Silben- oder Wortkombinationen - durchsucht und ihre Häufigkeit im zeitlichen Verlauf ermittelt. Viele Kulturwissenschaftler sind von diesen Möglichkeiten begeistert, weil sie glauben, auf diese Weise kulturelle Trends, technische Entwicklungen, politische Strömungen, kollektive Mentalitäten, ja sogar die Komplexität von Kulturen im großen Stil quantifizieren und empirisch untersuchen zu können.

Das publikumswirksame Etikett dafür ist „Kulturomik“, nachempfunden der Genomik, bei der ebenfalls gewaltige Datenmengen und schiere Rechenkraft entscheidend sind. Ein Gründungsdokument der ,culturomics’ war ein Artikel, der unter dem Titel „Die quantitative Analyse der Kultur auf der Basis von Millionen digitalisierter Bücher“ im vergangenen Jahr in „Science“ erschien. Zu den Autoren gehörten auch das Team von Google Books sowie Peter Norvig, einer der Forschungsdirektoren des Unternehmens.

Die deutsche Industrie, so hiesige Forscher, die für Google gearbeitet haben, betrachtet Wissenschaftler eher als Zulieferer, nicht als Quelle der Inspiration.

  Weitersagen Kommentieren Merken Drucken
Weitersagen

Regen in Paris

Von Nils Minkmar

Acht Monate lang durfte Regisseur Patrick Rotman den französischen Präsidenten Hollande begleiten. Entstanden ist ein Film über Regen und Depression. In Frankreichs Kinos scheint er zu floppen. Mehr 4