Damit künstliche Intelligenz Schweizerdeutsch verstehen kann, sammeln zwei Hochschule Dialekte und Wörter. js
1/1 Damit künstliche Intelligenz Schweizerdeutsch verstehen kann, sammeln zwei Hochschule Dialekte und Wörter. js
03.06.2021 07:00

Computer mit Thurgauer Wörter füttern

 ZHAW und FHNW digitalisieren Schweizer Dialekte

Zwei Hochschulen wollen die Dialekte der Schweiz digitalisieren, um künstlicher Intelligenz Schweizerdeutsch beizubringen. Die Bevölkerung kann sich am Projekt beteiligen.

Region Wir sind nicht nur unterschiedlich, sondern sprechen auch so. Appenzeller reden anders als St.Galler und Thurgauer verstehen Wallisser nur schlecht. Geschuldet ist das auch den verschiedenen Dialekten, die es gibt. Beliebtes Beispiel: die Überreste eines Apfels. Während den Ostschweizern «Bitzgi» ein Begriff ist, nennen Zürcher das Kerngehäuse der Frucht «Bütgschi» und Aargauer bezeichnen es als «Güürbsi». Diese Unterschiede sind mit ein Grund dafür, das Sprachassistenten wie Amazons Alexa oder Apples Siri Schweizerdeutsch nur schlecht verstehen. Ausserdem fehlt eine Datenbasis, damit Computer die Sprache lernen können. Die Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) und die Fachhochschule Nordwestschweiz (FHNW) wollen das nun ändern. Und dafür brauchen sie die Hilfe der Bevölkerung.

Den Computer füttern

Mithilfe von Sprachdateien, die Privatpersonen ab sofort einsenden können, soll einem Algorithmus beigebracht werden, Schweizerdeutsch zu verstehen und in Hochdeutsch umzuwandeln. «Mindestens zweitausend Stunden Aufnahmen von schweizerdeutschen Dialekten sollen zusammenkommen, damit wir eine gute Datenbasis haben», erklärt Mark Cieliebak vom ZHAW-Centre for Artificial Intelligence. Wer den Computer mit Thurgauer Wörter füttern will, kann das ganz einfach online unter www.dialektsammlung.ch machen. Freiwillige können dort eigene Audioaufnahmen erstellen, indem sie hochdeutsche Sätze in Mundart übersetzen oder die Aufnahmen von anderen Teilnehmenden überprüfen. Ebenfalls ersichtlich ist, aus welchen Kantonen bereits Sprachaufnahmen vorhanden sind und aus welchen Teilen des Landes noch Dialekte fehlen. Mit der Datensammlung und den trainierten Sprachmodellen können Sprachschnittstellen zu verschiedenen Anwendungen entwickelt werden. So könnte man beispielsweise mit Sprachassistenten auf Schweizerdeutsch sprechen, Firmen könnten automatisch Kundenfeedback auswerten, etwa Anrufe beim Kundendienst. Auch Untertitel für TV-Sendungen könnten automatisch erstellt werden.

Von Janine Sennhauser