Home
http://www.faz.net/-gqm-va4v
HERAUSGEGEBEN VON WERNER D'INKA, JÜRGEN KAUBE, BERTHOLD KOHLER, HOLGER STELTZNER
easyfolio

Internet „Unser System kann den Inhalt einer Internetseite erkennen“

Eines Tages soll es eine Suchmaschine geben, die nicht nur Wörter findet, sondern Inhalte versteht. Im Interview mit der F.A.Z. spricht der Sprachwissenschaftler David Crystal über das Ergebnis von 15 Jahren Arbeit, das semantische Web und die Ignoranz von Google.

© Vergrößern „Wir haben viel Zeit damit verbraucht, Google und Yahoo zu erklären, was wir tun und was wir können”

David Crystal, einer der führenden Sprachwissenschaftler, Herausgeber der „Cambridge Encyclopedia of the English Language“ und für seine Verdienste um die englische Sprache zum Ritter geschlagen, hat ein System entwickelt, das den Inhalt einer Internetseite versteht und in Zusammenhängen einordnen kann. Das deutsche Online-Werbeunternehmen Ad Pepper wird die Technik auf der Online-Messe OMD erstmals zeigen, um Werbung im richtigen Kontext einblenden zu können. Doch Crystal hofft auf mehr: Eines Tages soll eine Suchmaschine entstehen, die nicht nur Wörter findet, sondern den Inhalt versteht.

Herr Crystal, viele Menschen haben sich bisher am semantischen Internet versucht, das den Sinn der Seiten erkennt und nicht nur Wörter findet. Ohne Erfolg. Was haben Sie anders gemacht?

Mehr zum Thema

Die Wurzeln unseres Ansatzes liegen mehr als 15 Jahre zurück, als ich gebeten wurde, die große Cambridge-Enzyklopädie herauszugeben. Als die Menge der Begriffe immer größer wurde, waren wir gezwungen, etwa 1000 Kategorien zu entwickeln, um die Datenmenge zu klassifizieren. Das war in der ersten Hälfte der neunziger Jahre und lange bevor es Google gab. Die zweite Hälfte der neunziger Jahre habe ich dann damit verbracht, die Klassifikation auf das Internet auszuweiten und viele kommerzielle Kategorien hinzuzufügen, die mit dem realen Leben zu tun haben. Am Ende hatten wir dann 2000 Kategorien, in die sich alle Begriffe einordnen ließen, und fertig war unsere „Sense Engine“, mit der sich der Inhalt einer Internetseite erkennen ließ. Im Jahr 2000 haben wir das Unternehmen Crystal Reference gegründet, und in den ersten fünf Jahren des neuen Jahrtausends haben wir die Klassifikation auf möglichst viele Anwendungsgebiete erweitert.

Wofür kann Ihre „Sense Engine“ genutzt werden?

Am Anfang hatten wir einige Ansätze im Auge: Einen Filter für eine Suchmaschine, um die Relevanz der Suchergebnisse zu erhöhen. Oder eine automatische Dokumentenklassifikation oder eben kontextabhängige Werbung, die eine Anzeige immer nur in einem gewünschten Umfeld plaziert. Zum Beispiel war eine Werbung für Messer auf einer CNN-Seite, die über einen Straßenkampf berichtete, sicher nicht gewollt. Die dumme Software hatte in dem Artikel einfach das Wort „Messer“ gefunden und die Werbung des Messerherstellers eingeblendet. Sensible Software wie unsere schaut sich aber alle Wörter auf der Seite an, findet heraus, dass sich der Artikel um Verbrechen dreht und dass besser Werbung für Rechtsanwälte eingeblendet werden sollte.

Sie sind Sprachwissenschaftler. Die Online-Werbung als Einsatzgebiet war doch bestimmt nicht Ihr erster Gedanke?

Wir waren uns nicht sicher, welche Anwendung die beste ist und welche der Markt nachfragen wird. Alles hing davon ab, welches Unternehmen uns aufkauft. Anfang 2006 wurden wir dann von Ad Pepper übernommen. Das Unternehmen ließ keinen Zweifel daran, in welche Richtung wir gehen sollten, nämlich die Online-Werbung. Seitdem entwickeln wir das ganze Konzept in diese Richtung. Daraus entstand das Produkt iSense, das garantiert, dass die Werbung nur auf den gewünschten Plätzen erscheint und gefährliche oder sensible Inhalteumfelder wie Kriminalität, Erotik oder extremistische Inhalte gemieden werden. Werbung wird auf den Seiten mit maximaler Relevanz eingeblendet und von unerwünschten Seiten ferngehalten.

Die Internetbranche investiert sehr viel Geld in Werbesysteme, um dem Nutzer die richtige Werbung einzublenden. Können Sie das besser?

So etwas kann nicht von einem Stück Software erledigt werden. Es ist nicht möglich, einen Computer zu programmieren, diese Aufgaben zu tun. Der einzige Weg, um das Niveau der gewünschten Vorhersehbarkeit zu erreichen, ist ein Team von Menschen, das die Klassifizierung der Begriffe entwickelt hat. In den vergangenen 15 Jahren ist unser Team durch ein gesamtes Wörterbuch gegangen und hat jedes Wort und seinen Sinn klassifiziert. Jetzt sind wir fertig. Jetzt können wir den Sinn einer Internetseite erkennen und die passende Werbung dazu einblenden. Auch in deutscher Sprache.

Wäre es nicht sinnvoller, Ihre Technik für eine Suchmaschine zu nutzen?

1 | 2 Nächste Seite   |  Artikel auf einer Seite
 
 ()
   Permalink
 
 
 

Hier können Sie die Rechte an diesem Artikel erwerben

Weitere Empfehlungen
SpaceX Raumfahrtunternehmen verbündet sich mit Google

Das amerikanische Unternehmen SpaceX steht für die Privatisierung der amerikanischen Raumfahrt. Nun will Google rund eine Milliarde Dollar in die Firma investieren. Mehr Von Roland Lindner und Christian Schubert

20.01.2015, 16:51 Uhr | Wirtschaft
ARD-Reportage Die geheime Macht von Google

Vier Milliarden User googeln sich täglich weltweit durch das Internet. Längst ist Google zum Navigator durch den Alltag geworden. Allein in Europa laufen 90 Prozent der Suchanfragen über Google. Google sortiert uns die Welt, sucht für uns und findet. Google dominiert das Internet - eine ungeheure Macht. Ist die Suchmaschine tatsächlich so objektiv und verbraucherfreundlich, wie sie scheint? Oder verfolgt Google Absichten, die die Interessen der Verbraucher in Wahrheit verletzen? Die geheime Macht von google - Einblicke in einen Milliarden-Konzern, der wie kein anderer unseren Alltag unter Kontrolle hat. Mehr

02.12.2014, 08:39 Uhr | Aktuell
Zensur im Internet China zieht die Great Firewall höher

Dank der akribischen Überwachung und Zensur ist das chinesische Internet quälend langsam. Seit neuestem sind Facebook und Google noch nicht mal mehr über Umwege zu erreichen: Peking geht gegen Virtuelle Tunneldienste vor. Mehr Von Hendrik Ankenbrand, Schanghai

23.01.2015, 07:50 Uhr | Wirtschaft
Googles Vision von der totalen Vernetzung

Aktienkurse, Katzenvideos, Nachrichten: Wer im Internet sucht, der findet - und das meist mithilfe der Suchmaschine Google. Doch der Technologiekonzern will längst mehr sein: Das Internetunternehmen hat sich selbst zum Weltverbesserer erklärt. Und schraubt schon heute an einem komplett vernetzten Morgen Mehr

03.09.2014, 11:04 Uhr | Wirtschaft
Gesundheitsdaten in der Cloud Fitness-Falle Smartphone

Was kommt nach den Fitness-Trackern? Die Gesundheitsdaten wandern in die Cloud. Sie werden zentral ausgewertet und geprüft. So gläsern war der Mensch noch nie. Mehr Von Michael Spehr

29.01.2015, 11:37 Uhr | Technik-Motor
   Permalink
 Permalink

Veröffentlicht: 24.09.2007, 12:29 Uhr


Aktienkurse
Name Kurs Änderung
  Nasdaq 100 --  --
  Facebook --  --
  Google --  --
  Apple --  --
  Zynga --  --

Verfolgt im Internet

Von Martin Gropp

Die neuen Nutzungsbedingungen bescheren Facebook so manchen Abschied. Allerdings: Bei kostenfreien Diensten ist der Nutzer das Produkt. Aufgeklärte Netzbürger sollten das wissen. Mehr 12 15

Grafik des Tages Geldmaschine Real Madrid

Der umsatzstärkste Fußballclub ist ein spanischer. Viel Geld verdienen auch britische Vereine. Aus Deutschland schafft es in dieser Rangfolge nur einer unter die ersten zehn. Mehr


Die Börse
Name Kurs Änderung
  Dax --  --
  F.A.Z.-Index --  --
  Dow Jones --  --
  Euro in Dollar --  --
  Gold --  --
  Rohöl Brent --  --