Schweizer und Österreicher TTS Stimmen von Microsoft

Microsoft bietet seit kurzem eine tolle weibliche Schweizer TTS Stimme “Leni” an sowie Österreicher Stimmen. Im Test auf der Microsoft Demo Page klingt das beeindruckend gut.

In der automatischen Sprachsynthese (TTS) ist man meist enttäuscht, wenn man von amerikanischen Beispielen kommt, die aus sehr guten und vielfältigen Stimmen und Dialekten auswählen können. Schnell lernt man, daß die große englische Sprachzielgruppe viel besser versorgt ist, als kleine Sprach Nischen mit weniger potenziellen Nutzern. So gibt es nur wenig Auswahl deutscher Sprach Stimmen un bis vor kurzem gab es keine deutschen Dialekte von den großen Anbietern Google, Microsoft oder Amazon.

Mit den vor nicht allzu langer Zeit eingeführten Google Stimmen Wavenet-E (männlich) und Wavenet-F (weiblich) hat hier zwar noch einmal eine Verbesserung stattgefunden, die Formulierungen in ganzen Sätzen natürlicher klingen lassen, aber Microsoft hat nun auch etwas neues für kleine Zielgruppen parat. Schweizer Varianten für Deutsch und Französisch. Die Schweizer Varianten für Französisch konnte ich mangels ausreichender Kenntnis nicht testen aber die deutschen habe ich getestet.

Eigentlich bietet Microsoft sogar drei deutsche Stimmen für die Schweiz an: “Jan (Neural)”, “Leni (Neural)” und “Karsten”. Allerdings scheint sich die Stimme Leni sehr deutlich von den anderen beiden zu unterscheiden und wirklich hervorragende Ergebnisse zu erzielen.

Auf folgender Testseite von Microsoft könnt ihr euch selber von der Qualität überzeugen, indem ihr die Sprache “German (Switzerland)” auswählt und dann die Stimme “Leni (Neural)”. Selbst, wenn man im Textfeld ganz normalen hochdeutschen Text eingibt, erhält man eine Sprachausgabe in beeindruckendem Schweizerdeutsch.

https://azure.microsoft.com/de-de/services/cognitive-services/text-to-speech/#features

Screenshot:

Screenshot der Spracheinstellung auf der Microsoft Seite

Dieser Vorstoß von Microsoft passt zu meinem Bild, dass Microsoft von den großen Softwareanbietern am ehesten auch den europäischen Markt bedient, was sich zum Beispiel auch bei Datenschutz Themen und anderen speziell europäischen Anforderungen zeigt.

Einschränkungen in der Leistungsfähigkeit gibt es natürlich immer noch für Nischensprachen. Auf innovative Features wie zum Beispiel die Einstellung von Sprachstilen je nach Anwenderszenario (z.B. “Assitstant”, “Newscast”, “Customer Service”), die sachlicher oder fröhlicher klingen, müssen wir außerhalb der englischen Sprachen wohl noch etwas warten.

Screenshot:

Screenshot Microsoft Sprachstil
Screenshot der möglichen Sprachstile von Microsoft für “English (US)”

Insgesamt eröffnet die Bereitstellung von allgemein verfügbaren Schweizer TTS Stimmen aber allen innovativen Sprachapplikationen und Voicebots nun die Möglichkeit, besser auf dem Schweizer Markt angeboten zu werden, ohne aufwändig individuelle Lösungen bauen zu müssen. Das ist für alle Anbieter wichtig, die nicht nur in Deutschland sondern mindestens im DACH Markt mit Voice Services unterwegs sein wollen.

Photo by Dorothea OLDANI on Unsplash