28. Januar 2008 Das Problem kennt eigentlich jeder. Man ist den ganzen Tag in Besprechungen oder auf einer Messe, und abends sind Dutzende von Nachrichten auf der Handy-Mailbox. Das meiste ist nicht wichtig, aber man will ja nichts verpassen. So ging es vor einigen Jahren einer jungen Frau im Taxi. Die damals 27 Jahre alte Computerexpertin hatte 14 Nachrichten auf ihrer Mailbox. Mit Stift und Notizblock in der einen und dem Handy in der anderen Hand versuchte sie, die Nummern für erbetene Rückrufe aufzuschreiben. Warum ist das alles so zeitraubend und kompliziert, dachte sie. Viel praktischer wäre es doch, wenn man die Nachrichten als E-Mail oder SMS erhielte. Gibt es keine bessere Lösung? Sie fragte Freunde und Kollegen, bekam aber keine Antwort. Die Idee ließ Christina Domecq nicht mehr los. Nach anderthalbjähriger Vorbereitung gründete sie 2004 zusammen mit Daniel Doulton in Großbritannien das Unternehmen Spinvox. Kein leichtfertiger Entschluss - die junge Dame hatte ihr erstes Unternehmen in New York schon im zarten Alter von 20 Jahren gegründet.
Und nun macht Spinvox genau das, wovon Domecq immer geträumt hatte: Es wandelt Sprache in Text um und versendet die Nachrichten per E-Mail oder SMS, man kann damit aber auch übers Telefon Memos an sich selbst schicken oder gar in das eigene Blog diktieren. "Moment mal", mögen jetzt die Experten in Sachen Spracherkennung einwenden. Wie soll das funktionieren? Eine Spracherkennung muss sich doch zunächst an den jeweiligen Sprecher gewöhnen, oder nicht? Und was ist mit den Interpunktionszeichen? Kein Anrufer spricht mit der Mailbox so wie der Anwalt oder Arzt bei seinen Diktaten.
Das alles sind berechtigte Einwände, aber die Technik funktioniert trotzdem, und zwar verblüffend gut. Spinvox hat derzeit rund 140 000 Kunden in England, und derzeit läuft das System hierzulande im Testbetrieb. Es versteht Englisch, Französisch, Spanisch und Deutsch. Wer sich in Deutschland für den kostenlosen Versuchsbetrieb anmeldet (www.spinvox.com, das Kontingent ist begrenzt), bekommt eine Festnetzrufnummer in Düsseldorf zugewiesen. Nun leitet man das, was sonst auf der Handy-Mailbox oder dem Anrufbeantworter im Festnetz landet, einfach auf diese Düsseldorfer Nummer um (das kann ein paar Cent je Anruf kosten). Der Anrufer wird begrüßt und hinterlässt wie gewohnt seine Nachricht. Er muss nichts beachten und kann reden, wie ihm der Schnabel gewachsen ist. Bis zu drei Minuten lang. Sogar mit Dialekt. Die Aufzeichnung landet im Rechenzentrum von Spinvox, wird dort automatisch von einer Spracherkennung umgesetzt. Die durchschnittliche Nachricht dauert ungefähr 30 Sekunden, und man erhält dann zwei bis drei SMS auf sein Handy. Oder das Ganze per E-Mail.
Wir haben unser Bürotelefon auf Spinvox umgeleitet, um die Qualität zu prüfen. Die Ergebnisse sind erstaunlich gut. Das System setzt automatisch Punkt und Komma, der Sinnzusammenhang ist aus der Transkription stets einwandfrei ablesbar, auch wenn natürlich etliche kleine Fehler gemacht werden. Da sagt jemand "Ja, ich habe gewisse Zweifel", und in der E-Mail steht "ich hab Gewissen Zweifel". Die diffizilen Feinheiten der Sprache - etwa Groß-, Klein-, Zusammen- und Getrenntschreibung, Kasus und Genus -, die auch eine herkömmliche Spracherkennung an ihre Grenzen bringen, bereiten Probleme. Aber selbst ein komplizierter Brocken wie "er hat mich netterweise mit seiner B-Klasse von Mercedes-Benz nach Hause gebracht" wurde einwandfrei erkannt, ebenso das bayrisch dahingenuschelte "Servus, Moni, wenn wir uns morgen beim Metzger treffen, dann schauen wir mal, wie's dem Lucki geht" eines Kollegen. Wenn das Spinvox-System mehr als drei Worte in einer Nachricht nicht versteht, schickt es eine E-Mail oder SMS mit dem Hinweis, dass diese nicht konvertierbar ist. Man kann sie dann wie gewohnt über die Düsseldorfer Rufnummer abhören (was auch mit den erfolgreich transkribierten Nachrichten funktioniert). Hat das System bei einzelnen Begriffen Zweifel, markiert es das Wort mit einem Fragezeichen. Anrufe aus dem fahrenden Auto oder in lauter Umgebung wurden ebenfalls gut umgesetzt, nur bei Diktaten von Fachtexten macht Spinvox schnell schlapp - es ist eben für gewöhnliche Anrufbeantworter-Aufzeichnungen programmiert. Wer Spinvox unverbindlich testen will, kann einen Blick auf die Internetseite http://ifrademo.livejournal.com werfen.
Der praktische Nutzen ist immens. Wer üblicherweise morgens im Büro eine halbe Stunde lang 20 Nachrichten nacheinander abhört, Rufnummern aufschreibt und das Wichtige vom Unwichtigen trennt, hat jetzt den schönen Komfort, dass jeder Anruf (mit der Nummer des Anrufenden, falls nicht unterdrückt) in der E-Mail oder im SMS-Eingang des Handys aufgelistet ist. Bei SMS-Zustellung mit dem Blackberry lässt sich sogar eine kleine Software installieren, die automatisch den Namen des Anrufers aus dem Telefonbuch heraussucht. Und es entfällt das langwierige Abhören, wenn man einen mitteilungsbedürftigen Zeitgenossen auf dem Anrufbeantworter hat, der erst am Schluss seine Rückrufnummer durchgibt.
Wie Spinvox genau funktioniert, will man aus Angst vor Nachahmern nicht verraten. Es sitzen jedenfalls in England keine Schreibkräfte, die alles abtippen. Man habe verschiedene Spracherkennungssysteme gekauft und miteinander verbunden sowie viel selbst entwickelt, sagt Deutschland-Chef Bernd Günßler. Das deutsche Wörterbuch enthält mittlerweile rund 500 000 Einträge und rund drei Millionen verschiedene Stimmmuster. Entscheidend sei, dass sich Spinvox im Unterschied zu einem PC-Spracherkenner mehr Zeit nehmen kann. Während einer Software wie Dragon Naturally Speaking nur wenige Millisekunden zur Erkennung in Echtzeit zur Verfügung stehen, arbeitet Spinvox bis zu drei Minuten an einer Datei. Wenn der automatische Erkenner an seine Grenzen stößt, werden die entsprechenden Audio-Schnipsel von Menschen ausgewertet. Es ist also ein lernendes System, und auf diese Weise wächst das Wörterbuch. Bislang wurden rund 50 Millionen Nachrichten konvertiert, Spinvox hat 380 Mitarbeiter in aller Welt.
In Deutschland bleibt es nicht bei dem hier beschriebenen Testbetrieb. Die Leute von Spinvox wollen ihren Dienst den Netzbetreibern anbieten, so dass beispielsweise ein Handy-Kunde bei Vodafone die Spinvox-Mailbox dazu buchen kann. Die Rufumleitung nach Düsseldorf würde dann entfallen. Das mag ein paar Euro im Monat kosten, aber wir halten diese Sache für so ausgereift, praktisch und vor allem zeitsparend, dass wir sofort dabei wären. In Großbritannien werden 80 Prozent derjenigen, die sich für einen kostenlosen Testbetrieb anmelden, zahlende Kunden des Unternehmens. In den Vereinigten Staaten und Kanada hat Spinvox bereits Verträge abgeschlossen, Vodafone Spanien ist demnächst dabei. Ferner gibt es Schnittstellen für Facebook und Twitter, also die sozialen Kontaktnetzwerke im Internet. Denkbar sind mit dieser revolutionären Spracherkennung auch ganz neue Dienste, etwa Lösungen für Call-Center und vieles mehr. Vielleicht verschwinden dann endlich die "dummen" Voicemail-Systeme, die viele Unternehmen im Einsatz haben. Michael Spehr
Text: F.A.Z., 29.01.2008, Nr. 24 / Seite T2