Im Gespräch mit Michal Měchura Wenn die Maschine den Menschen fragt

Der Sprachtechnologe Michal Měchura wollte immer schon ein Tool, das es Übersetzungsmaschinen ermöglicht, in Zweifelsfällen den Menschen Fragen zu stellen. Mit Fairslator hat er selbst solch ein Tool entwickelt. Michal spricht mit uns über Bias und Mehrdeutigkeit in maschinellen Übersetzungen.
 

Von Stephanie Hesse

Michal Měchura, eines der ersten Sätze auf der Website fairtranslator.com lautet: „Wir müssen über Bias in maschinellen Übersetzungen sprechen.“ Warum?

Wir müssen über Bias in maschinellen Übersetzungen sprechen, weil dieses Problem tatsächlich existiert. Sieht man sich die Entwicklung der Maschinenübersetzung genauer an, sollte sie zunächst den Nutzer*innen eine sehr direkte und lineare Erfahrung bieten: Sie geben einen Text in der einen Sprache ein und erhalten ihn in der anderen Sprache zurück. So entsteht der irreführende Eindruck, dass es immer eine korrekte Übersetzung gäbe. In Wirklichkeit ist das jedoch nicht so einfach: Der Ausgangstext enthält oft Mehrdeutigkeiten, die nicht automatisch beseitigt werden können. Es ist daher notwendig, den menschlichen Nutzer zu fragen, was er mit bestimmten Formulierungen meint.

Die eigentliche Ursache für Bias ist, dass bestehende maschinelle Übersetzer von einer einzigen Annahme ausgehen. Dieses Problem beschäftigt mich schon lange. Es hat mich immer gestört, dass maschinelle Übersetzer mich nie fragten, wie ich bestimmte Dinge meinte. Deshalb habe ich mir ein Werkzeug gewünscht, das mir Fragen stellen konnte, bis ich selbst eines entwickelte.

Können Sie kurz beschreiben, was Fairslator macht und wie es funktioniert?

Fairslator ist ein Plug-in, mit dem man eine Übersetzungsmaschine wie Google Translate, DeepL oder Microsoft Translator erweitern kann. Zurzeit funktioniert Fairslator bei Übersetzungen aus dem Englischen ins Deutsche, Tschechische oder Irische. Es versucht den Output der maschinellen Übersetzung dort auf Bias zu prüfen, wo sich der maschinelle Übersetzer für eine bestimmte Lesart entschieden hat, jedoch auch andere Lesarten möglich sind. Dann bietet es Alternativen für die Übersetzung des mehrdeutigen Ausdrucks an.

Denken wir an folgendes Beispiel: Die Übersetzung könnte voreingenommen sein, wenn „teacher“ männlich gelesen wird. In vielen Fällen kann die Mehrdeutigkeit nicht aus dem Text selbst ausgeschlossen werden. Die meisten maschinellen Übersetzer setzen die Wörter ein, die in den Trainingsdaten statistisch am häufigsten vorkommen. Fairslator jedoch kann aktiv zur Eindeutigkeit beitragen, indem es Nutzer*innen fragt: Soll „teacher“ mit der männlichen Form („Lehrer“) oder der weiblichen („Lehrerin“) übersetzt werden? Das hilft, in Übersetzungen besser zum Ausdruck zu bringen, was ich meine.

Ist das was Sie einen „Human-in-the-Loop Übersetzer” nennen?

Ja genau. Seit Kurzem zeigt sich in der KI, dass der Mensch in die Schleife mit der Maschine gebracht wird. Es hat sich herausgestellt, dass bestimmte Dinge für die KI zu komplex sind, daher muss man Menschen einschalten. Genau das macht Fairslator. Vielleicht erinnern Sie sich an die Zeit, bevor maschinelle Übersetzungen zur großen Sache wurden. Man investierte viel Mühe in computerunterstützte Übersetzungen: Menschen übersetzten, während im Hintergrund die Software lief und Vorschläge machte, wie etwas übersetzt werden könnte. Der Mensch hatte immer die Kontrolle, er musste die Vorschläge annehmen, verwerfen oder diese Übersetzungen bearbeiten. Jetzt hat sich diese Balance verlagert, und wir haben Systeme, die vollständig automatisch Texte übersetzen. Vielleicht müssen wir mit Menschen das Gleichgewicht wiederherstellen. Ich nenne dies auch „menschenunterstützte maschinelle Übersetzung“.

Welche Arten von Bias interessieren Sie in diesem Projekt? Können Sie einige Beispiele nennen?

Maschinelle Übersetzungen enthalten oft Bias, der aufgrund von Mehrdeutigkeiten von Gender, Numerus und Anredeformen entsteht. Übersetzt man beispielsweise vom Englischen ins Französische, stellt sich die Frage, ob man „student“ als männlich „étudiant“ oder weiblich „étudiante“ übersetzen soll. Soll „you“ als informelles „tu“ oder formelles „vous“ übersetzt werden? Bias kann in Übersetzungen in vielen Kontexten auftreten, aber ich konzentriere mich auf Bias, die sehr oft vorkommt. Und sogar in dieser kleineren Teilgruppe von Bias handelt es sich um ein breites und komplexes Gebiet. Die Forschung über geschlechtsspezifischen Bias hat sich auf die leichten Fälle konzentriert, die Früchte, die unten hängen, wie die männlichen und weiblichen Formen von Nomen. Aber in vielen Sprachen sind es andere Wortarten, die geschlechtsspezifischen Bias enthalten. In den slawischen, aber auch in einigen romanischen Sprachen wie Französisch muss man oft die Adjektive und das Partizip Perfekt anpassen. Das sind nur einige Beispiele, die zeigen, wie komplex dieses Thema ist.

Wie geht Fairslator mit der beabsichtigten geschlechtergerechten Sprache um?

Fairslator hat eine Funktion, die geschlechtergerechte Sprache ermöglicht. Für deutsche Nomen beispielsweise schafft es automatisch Gender-Sternchen und andere Neubildungen. Es ist nicht immer einfach, geschlechtergerecht zu formulieren, da Adjektive, Artikel oder andere Wortarten im Satz grammatikalisch aufeinander bezogen sind. Fairslator tut sein Bestes, geschlechtergerechte Formen anzubieten.

Übersetzungsmaschinen erkennen diese Probleme und suchen nach einer Lösung. So bieten sie beispielsweise Alternativen wie „Arzt“ oder „Ärztin“, wenn „doctor“ übersetzt werden soll. Was halten Sie von solch einer Lösung?

Ja, das ist richtig, Maschinenübersetzer haben begonnen, mehrere Optionen anzubieten. Das Problem sehe ich darin, dass sie die Unterschiede zwischen den verschiedenen Möglichkeiten nicht erklären. Besonders wenn man die Sprachen, in die man übersetzen lässt, nicht selbst beherrscht, ist das problematisch. Ich habe viel Zeit verwendet, um eine Lösung zu finden, die „baby proof“ ist, sodass Menschen, die noch nie gehört haben, dass es in anderen Sprachen männliche und weibliche Wörter gibt, diesen Unterschied trotzdem verstehen können. Es geht darum, Mehrdeutigkeiten in der Ausgangssprache statt in der Zielsprache zu beseitigen.

Welche Pläne haben Sie für den Fairslator in den nächsten Monaten und Jahren?

Ich träume davon, dass die Funktion, die Fairslator bietet, eines Tages zu den Standardfunktionen von Übersetzungsmaschinen gehört.

Noch weiter in die Zukunft gedacht, träume ich davon, dass Menschen aufhören, immer über Übersetzungen zu sprechen. Statt sich zu fragen, wie man etwas richtig übersetzt, sollte man sich fragen, was man zu sagen hat und dies in der Ausgangssprache möglichst klar und deutlich formulieren. Beginnen wir darüber zu sprechen, wie man Ideen gleichzeitig in vielen verschiedenen Sprachen ausdrücken kann. Es wäre die Mühe wert, einen Schritt zurückzutun und diese Veränderung in den Köpfen der Menschen geschehen zu lassen.