Ein neues KI-Programm übersetzt in fünf rätoromanische Idiome und in die Schriftsprache Rumantsch Grischun. Es wurde auf den Namen «Alas», deutsch «Flügel» getauft.
Das neue Übersetzungsprogramm Alas für Deutsch ins Rätoromanisch wurde von der Universität Zürich und der Lia Rumantscha entwickelt. Es generiert auf Knopfdruck gratis Übersetzungen in jedes der fünf Idiome des Rätoromanischen sowie in die Schriftsprache Rumantsch Grischun.
Rätoromanisch hat fünf verschiedene Sprachvarianten – Sursilvan, Sutsilvan, Surmiran, Puter und Vallader –, die insgesamt von rund 100’000 Menschen gesprochen werden. Die Diversität dieser Idiome ist eine Herausforderung, wenn KI-Programme auch Rätoromanisch unterstützen sollen.
Die fünf verschiedene Sprachvarianten – Sursilvan, Sutsilvan, Surmiran, Puter und Vallader – werden von rund 100’000 Menschen gesprochen. (Bild: Lia Rumantscha)
Um den Stand der Technik zu verbessern, kontaktierte die Lia Rumantscha, der Dachverband aller romanischen Sprachvereine, ein KI-Forschungsteam an der Universität Zürich. Gemeinsam haben sie nun das erste Übersetzungsprogramm entwickelt, das die fünf Idiome unterstützt. Es heisst Alas und kann Texte automatisch von Deutsch in die rätoromanischen Idiome übersetzen und zurück. Zusätzlich zu den Idiomen wird auch die Schriftsprache Rumantsch Grischun unterstützt.
Erstes Übersetzungsprogramm dieser Art
KI-Assistenten wie ChatGPT beherrschen zwar bereits heute zu einem gewissen Grad Rumantsch Grischun. So hat das UZH-Spin-off Supertext bereits vor vier Jahren ein Übersetzungsprogramm für die rätoromanische Schriftsprache auf den Markt gebracht. Doch die fünf Idiome des Rätoromanischen waren bis jetzt zu schwierig für die KI.
Alas macht deutlich bessere Übersetzungen als bestehende KI-Assistenten. (Bild: UZH)
Alas wurde nun gezielt auf Tausenden von Beispieltexten trainiert. «Am Anfang brachte das KI-Modell die Idiome noch durcheinander», sagt Jannis Vamvas, Computerlinguist an der Universität Zürich, «doch im Lauf des Trainings wurde es immer besser darin, sie auseinanderzuhalten.» Zu Trainingszwecken übersetzte Alas Berichte von RTR und Zeitungsartikel, aber auch literarische Werke, Schulbücher, sowie Texte von Gemeinden und dem Kanton Graubünden.
Vielversprechender Blindtest
Nach dem Training von Alas lud das Forschungsteam Muttersprachler und Muttersprachlerinnen der fünf Idiome zu einem Blindvergleich ein. Der Test wurde für Übersetzungen vom Deutschen ins Rätoromanisch ausgeführt, weil dort die meisten Schwierigkeiten bestehen. «Der Blindvergleich hat uns bestätigt, dass Alas deutlich bessere Übersetzungen produziert als bestehende KI-Assistenten», sagt Jannis Vamvas von der Universität Zürich. «Die Übersetzungen sind inhaltlich genauer und werden für idiomatischer befunden.» Noch besser schnitten nur von Menschen gemachte Übersetzungen ab.
Benutzen kann man das Übersetzungsprogramm Alas gratis über die Website alas.liarumantscha.ch. Für Technikprofis ist das zugrundeliegende KI-Modell zudem als Open-Source-Software zugänglich – sie können es unter die Lupe nehmen und gegebenenfalls weiterentwickeln.
Titelbild: In Scuol wird ein anderes Idiom gesprochen als in Disentis oder in Bravuogn: Das macht Übersetzungen ins Rätoromanische so schwierig. (Bild: istock.com/AscentXmedia)
