Texte vorlesen? | Wanhoff.de

Sorry, lieber Ulf Beyschlag, wenn es um Barrierefreiheit

4 thoughts on “Texte vorlesen?”

Es gibt keine Software, die dem Thema Barrierefreiheit einen schlimmeren Imageschaden verpasst als Readspeaker. Jede Sprachausgabe, die blinden Menschen Webseiten zugÃ¤nglich macht, spricht besser als Readspeaker. Readspeaker ist auch kein Podcastersatz oder Podcastwerkzeug. Ich bin durchaus fÃ¼r LÃ¶sungen fÃ¼r Menschen mit Lernschwierigkeiten, die nicht gut Lesen kÃ¶nnen, aber diese QualitÃ¤t kann nicht die LÃ¶sung sein. Und teuer ist sie auch noch.

Da ich hier direkt angesprochen wurde, reagiere ich auch gerne auf beide EintrÃ¤ge.

ZunÃ¤chst zu QualitÃ¤t und Barrierefreiheit. Wir kaufen grundsÃ¤tzlich die besten Text-To-Speech (TTS) LÃ¶sungen ein, die es fÃ¼r die deutsche Sprache gibt. DarÃ¼berhinaus haben wir WÃ¶rterbÃ¼cher pro Stimme und auch pro Kunde, Ã¼ber die wir laufend die AussprachequalitÃ¤t noch weiter verbessern. Und Ã¼ber regelbasierende Systeme optimieren wir das Vorlesen in Echtzeit websitespezifisch. Insofern ist es kaum mÃ¶glich, dass es eine Sprachausgabe gibt, die qualitativ besser sein kann. FÃ¼r Hinweise bin ich dankbar. Die Bemerkung zum Image kann ich absolut nicht nachvollziehen und wird auch nicht von den relevanten Gruppen geteilt. Entscheidend ist, ob eine Funktion vom Markt angenommen wird. Und das ist sowohl bei Websiteanbietern und Nutzern der Fall.

Nun zu Cinema. Hier bin ich mit Thomas Wanhoff einer Meinung, dass die derzeitige QualitÃ¤t nicht zufriedenstellend ist. Bei diesem spezifischen Podcast helfen keine WÃ¶rterbÃ¼cher mit 240.000 WÃ¶rtern und eine zweisprachige TTS. Da gibt es einfach zu viele englische WÃ¶rter und Namen. Hier habe ich der Redaktion bereits eine systematische ErgÃ¤nzung des WÃ¶rterbuchs vorgeschlagen. Vom extremen Einzelfall lÃ¤ÃŸt sich aber nicht auf die Allgemeinheit schlieÃŸen.

Ich habe mir den Beitrag von Cinema gerade einmal angehÃ¶rt – der klingt wirklich grausig!

Aus betriebswirtschaftlicher Sicht kann ich Herrn Beyschlags Aussage verstehen – es ist natÃ¼rlich entscheidend, ob eine Funktion vom Markt angenommen wird oder nicht. Allerdings sollte aus linguistischer Sicht schon ein gewisser “QualitÃ¤tsanspruch” vorhanden sein.

Ich verstehe die Aussage “Bei diesem spezifischen Podcast helfen keine WÃ¶rterbÃ¼cher mit 240.000 WÃ¶rtern und eine zweisprachige TTS” nicht.
Ein zweisprachiges TTS-System wÃ¤re aus linguistischer Sicht exakt das, was die Website benÃ¶tigt, oder nicht?! Andernfalls wird man nie die QualitÃ¤t bekommen, die ein *normales* ZuhÃ¶ren ermÃ¶glicht.

NatÃ¼rlich ist es mÃ¶glich, ein vorhandenes WÃ¶rterbuch so auszuweiten, dass einigermaÃŸen passable Ergebnisse dabei herauskommen (bei dem angesprochenen Podcast geht es ja ums FilmgeschÃ¤ft – der 1. logische Schritt wÃ¤re meiner Meinung nach also eine Ausweitung des WÃ¶rterbuchs auf Namen von bekannten Schauspielern!).

Allerdings wird das zugrundeliegende System immer deutsche Ausspracheregeln anwenden, was die QualitÃ¤t erheblich beeintrÃ¤chtigt.

Ein LÃ¶sungsansatz hierfÃ¼r wÃ¤re meiner Meinung nach NICHT eine zweisprachige Stimme im herkÃ¶mmlichen Sinn (so mÃ¼sste man immer Kompromisse bei den Ausspracheregeln machen), sondern 2 unterschiedliche Stimmen der beiden Sprachen (hier ja offensichtlich Deutsch und Englisch) vom gleichen voice talent. Man nehme einen bilingualen Sprecher und entwickle 2 Stimmen mit ihm, eine deutsche und eine englische. Nun lÃ¤sst man bei der Generierung des Podcasts eine syntaktische und semantische Analyse des Eingabetexts laufen um zu ermitteln wo “FremdwÃ¶rter” (Basis-Sprache: Deutsch, “FremdwÃ¶rter”: Englisch) auftauchen. AbschlieÃŸend annotiert man den Eingabetext aufgrund der Analyse (z.B. mit SSML) und schickt ihn an das TTS-System mit den beiden Stimmen (dieses muss natÃ¼rlich in der Lage sein, SSML-Tags on-the-fly umzusetzen, ein solches System bietet z.B. die Firma Cepstral aus Pittsburgh).
Ich habe das hÃ¤ndisch, sprich durch mehr oder weniger manuelle Auszeichnung des Eingabetexts – allerdings mangels zweier Stimmen vom gleichen voice talent mit 2 unterschiedlichen Stimmen – schon einmal umgesetzt und es funktioniert technisch recht gut.
Leider habe ich bis jetzt noch nie gehÃ¶rt, dass eine Firma mit einem bilingualen Sprecher 2 Stimmen entwickelt hat – ein Versuch wÃ¤re es wert.

FÃ¼r Kommentare zu meinem LÃ¶sungsansatz wÃ¤re ich dankbar.

Ach ja: Ich werde mit Interesse verfolgen, wie das System auf heise.de “angenommen” wird – aber viel wichtiger: Wie ist die QualitÃ¤t des TTS-Systems in der (sehr englischlastigen) DomÃ¤ne Computer/Internet/Technik?!
Man darf gespannt sein …

Comments are closed.

4 thoughts on “Texte vorlesen?”

Das Weblog von Thomas Wanhoff