Home
http://www.faz.net/-gum-2qng
HERAUSGEGEBEN VON WERNER D'INKA, BERTHOLD KOHLER, GÜNTHER NONNENMACHER, FRANK SCHIRRMACHER, HOLGER STELTZNER

Text-to-Speech "Der Markt dürfte in Kürze explodieren"

06.07.2001 ·  Software, die Texte in Sprache umsetzt hat ein enormes wirtschaftliches Potenzial. Doch noch steckt der Markt in den Kinderschuhen. Ein FAZ.NET-Interview.

Artikel Lesermeinungen (0)

Der technologische Fortschritt auf dem Kommunikationssektor kennt kein Halten. Für Software, die geschriebene Texte in gesprochene Sprache umsetzt, so genannte Text-to-Speech Software, gäbe es viele Anwendungsbereiche: Vorlesen von E-Mails, Beantwortung von Standardfragen in Call-Centern, persönliche Börseninformationen und vieles mehr.

Aber bislang mangelt es häufig noch an der Qualität der Sprache, um wirklich zufriedenstellende Ergebnisse zu erzielen. Dennoch hat die Technologie wirtschaftliches Potenzial. Über den Stand der Technologie und seine Marktchancen sprach FAZ.NET mit Volker Jantzen, dem Geschäftsführer von Svox-Systems, einem so genannten Spin-off der ETH Zürich und Anbieter vor allem deutschsprachiger Text-to-Speech Software.

Herr Jantzen, entstanden ist die Text-to-Speech Technik aus einem Projekt für Blinde heraus. Wie ging oder wie geht es weiter?

Mittlerweile gibt es interessante kommerzielle Anwendungen im Bereich Telekommunikation, Informationsdienste so genannte Voice Portals und Voice-Commerce. Text-to-Speech Software wird heute vor allem zusammen mit Spracherkennungssoftware eingesetzt, so kann man zum Beispiel Call Center Mitarbeiter von Routineanfragen entlasten.

Was ist der Ansatz SVOX. Mit welcher Idee gehen Sie in den Markt?

SVOX positioniert sich als Technologiefirma. Das Produkt der Firma SVOX sind Software-Komponenten für Text-to-Speech-Anwendungen, die ein Systemintegrator in eine Gesamtlösung für Auskunftsdienste, für Voice-Shops oder V-Commerce-Systeme einbaut.

Sie bieten im Internet eine Demo Version an. Und da stößt man auf Probleme. Erstens hat das System Schwierigkeiten englische Fremdworte auszusprechen, zweitens produziert es eine Automatenstimme. Was sagen Sie zu diesen Vorwürfen, wenn ein Kunde Sie damit konfrontiert?

Das Problem englische Fremdwörter nicht adäquat auszusprechen ist technisch leicht zu lösen und wird bald schon in der Demo angeboten. Die Tatsache, dass wir es hier mit einer Computerstimme zu tun haben, ist dagegen grundlegend mit dem technischen Ansatz verbunden. Dort sind in der letzten Zeit sehr grosse Fortschritte gemacht worden, vor allem ist die Natürlichkeit stark verbessert worden. Svox gehört zu den führenden Anbietern hochgradig natürlich klingender Stimmen Für viele Anwendungen sind die Stimmen sehr gut geeignet, vor allem, wenn häufig wechselnde Informationen darin vorkommen.

Sie haben Call-Center als mögliche Kunden für Text-to-Speech-Anwendungen erwähnt. Können Sie das konkretisieren und erläutern?

Zum einen können einfache Anfragen automatisiert behandelt werden. Das hat für den Kunden den Vorteil, dass er weniger lange in der Warteschleife zubringen muss. Für den Call-Center-Mitarbeiter bedeutet es eine Entlastung von Standardanfragen und er kann sich auf die wirklich schwierigen Fälle konzentrieren, die ohne den Menschen nicht zu beantworten sind. Mit Sprachsoftware können bis zu 90 Prozent der Kosten eines Call-Centers eingespart werden.

Ihr Unternehmen ist relativ neu am Markt. Wie finanzieren Sie sich derzeit?

Svox wird momentan durch das Kapital der Gründer und zwei Business Angels finanziert. Derzeit genügt uns diese Seed-Finanzierung. Wir führen aber auch Gespräche für eine Finanzierungsrunde mit Wagniskapital, die wir etwa für den Anfang des nächsten Jahres planen. Wir machen dort die Erfahrung, dass das Interesse, in den Stimme- und Sprachtechnologiebereich zu investieren, sehr groß ist.

Der Weltmarkt für Text-to-Speech-Anwendungen hatte im letzten Jahr etwa ein Volumen im zweistelligen Millionen Dollar Bereich. Die Prognosen sehen in den nächsten Jahren bereits ein Volumen von mehreren Milliarden Dollar voraus. Wie ein solcher rapider Anstieg zustande kommen?

Es ist ein Markt, der gerade neu entsteht. Bis vor zwei, drei Jahren gab es praktisch keine Services. Im letzten Jahr wurden gerade in Amerika sehr viele solcher Dienstleistungen lanciert. Die Experten sind der Ansicht, dass auch in Europa in den nächsten Monaten und Jahren sehr viele automatisierte Voice-Services aufgebaut werden, und unsere Erfahrungen zur Marktentwicklung bestätigen dies. Wir teilen die Auffassung, dass der Markt in Kürze explodieren wird. Ob es dann wirklich die prognostizieren Milliardenbeträge werden, wird sich zeigen.

Ihr Unternehmen fängt neu an in der Schweiz und in Deutschland. Es gibt Unternehmen und Konzerne in Amerika, die haben schon einige Jahre Erfahrung Vorsprung. Ist nicht davon auszugehen, dass die demnächst hier angreifen?

Man muss unterscheiden. Es gibt einige so genannte Speech-Integrator in Amerika, Firmen, die Sprachlösungen als Pakete zusammenstellen und den Kunden anbieten. Solche Integratoren adressieren wir als unsere Kunden. Wir stellen unsere Text-to-Speech-Komponente zur Verfügung, die dann Bestandteil einer Komplettlösungen werden kann. Anders im Software-Bereich Text-to-Speech im engeren Sinne. Da gibt es, gerade für Sprachen außer Englisch, wenig Konkurrenz. Unsere Technologie ist so fortgeschritten, dass wir mit unserem Produkt technologisch weltweit zu den führenden Anbietern zählen.

Inwieweit könnte der bevorstehende UMTS-Start einen Schub geben?

Das wird für den Markt sicher einen gewaltigen Schub geben, weil die Telekommunikations-Konzerne Großinvestitionen getätigt haben und nun verstärkt Services anbieten müssen, um auch Profite zu generieren. Diese Services werden zu einem großen Teil Voice-basierte-Anwendungen sein. Man erwartet in der Regel, dass es eine Spracheingabe gibt, die mit Text-to-Speech-Anwendungen beantwortet wird, beispielsweise aktuelle Informationen zum persönlichen Aktiendepot in Kombination mit Grafiken und Videostreams. Text-to-Speech wird dabei auf Grund der Flexibilität der Anwendung ein große Rolle spielen.

Wenn ich als Unternehmen an Sie herantrete und einen solchen Dienst haben möchte, mit einer Stimme, die eigens für mein Unternehmen stehen soll. Wieviel kostet das dann?

Das hängt stark davon ab, was genau Sie sich vorstellen, auch davon, wie die Stimme strukturiert ist. Der Preis liegt etwa im Bereich von 60.000 bis 100.000 Euro. Dafür können wir eine individuelle Stimme anbieten, über die nur ihre Firma verfügt. Und sie können sogar eine schon verwendete Stimme, also etwa ihre existierende Corporate Voice, mitbringen und wir machen darauf basierend eine individuelle Text-to-Speech-Stimme.

Der Vorteil ist, dass diese Stimme gleichsam für die Ewigkeit ist. Mit dieser Stimme kann ich, wenn sie einmal produziert ist, so lange arbeiten wie ich möchte?

Damit können Sie jeden beliebigen Text sprechen lassen. Im Gegensatz dazu müssen sie bei Systemen, die mit der Aufnahme natürlicher Stimmen arbeiten, bei jeder Änderung oder Ergänzung der alten Texte erneut ins Tonstudio. Das fällt bei Text-to-Speech Software weg.

Welche Strategie verfolgt Ihr Unternehmen in der nächsten Zeit? In welche Aktivitäten wollen Sie das Geld einer Finanzierungsrunde durch Wagniskapital investieren?

Wir verfolgen die Strategie, im deutschsprachigen Markt möglichst schnell eine führende Position einzunehmen. Wir sind der Überzeugung, dass wir auf Grund unserer Stärke in der deutschsprachigen Text-to-Speech Software dies auch leisten zu können. Das Kapital wird zum einen stark in die Entwicklung gesteckt: die Realisierung weiterer Sprachen, englisch, französisch und italienisch, die wir noch in diesem Jahr auf den Markt bringen wollen. Zum anderen wollen wir die Verbesserung der Sprachqualität voran bringen und eine größere „Natürlichkeit“ der erzeugten Stimmen erreichen.

Auf der Vertriebsseite möchten wir in Europa expandieren. Wir wollen in Deutschland, Frankreich, England präsent sein und mittelfristig auch in den USA.

Das Gespräch führte Ansgar Mayer

Quelle: @wiz
Hier können Sie die Rechte an diesem Artikel erwerben

  Weitersagen Kommentieren Merken Drucken
Weitersagen
Themen zu diesem Artikel