Wie „arbeitet“ künstliche Intelligenz in literarischer Übersetzung

Illustration: Drei Personen und ein Roboter sitzen nebeneinander an Tischen mit Laptops.

Wie "arbeitet" künstliche Intelligenz im Bereich literarischer Übersetzung | Philippos Vassiliades | CC-BY-SA

Als Google Translate in 2006 eingeführt wurde, konnte es gerade mal zwei Sprachen übersetzen. 2016 waren es über 103 Sprachen und es übersetzte über 100 Milliarden Wörter am Tag. Das System kann nicht nur übersetzen, sondern transkribiert in Echtzeit acht der meist verbreiteten Sprachen. Maschinen lernen und sie lernen schnell.

Von Alana Cullen

Es gibt jedoch einige linguistische Codes, die diese Maschinen noch knacken müssen. Künstliche Intelligenz kämpft weiterhin mit der enormen Komplexität menschlicher Sprache,und nirgendwo ist Sprache so komplex und bedeutungsvoll wie in der Literatur. In Romanen, Gedichten und Theaterstücken liegt die Schönheit der Wörter oft in den Nuancen und der Subtilität. Maschinen übersetzen Wort für Wort, und sie folgen dabei den Regeln, die die Linguistik gesetzt hat, deshalb verstehen traditionelle Übersetzungssysteme oft nicht die Bedeutung literarischer Texte. Sie begreifen für das zu übersetzende Wort nicht im Kontext des Satzes, Paragraphen oder der Seite.

Aber es gibt eine neue Technologie, die sich mit diesem kontextuellen Chaos beschäftigt – Neural Machine Translation (Neuronale Maschinelle Übersetzung), kurz NMT genannt. Obwohl es noch in den Kinderschuhen steckt, hat NMT bereits bewiesen, dass ihre Systeme mit der Zeit lernen werden, die Komplexität von literarischen Übersetzungen zu bewältigen. NMT markiert den Beginn einer neuen Ära für künstliche Intelligenz. Sie operiert nicht mehr nach den Regeln, die Linguist*innen gesetzt haben – sie erstellt nun ihre eigenen Regeln und sie kreiert sogar ihre eigene Sprache.

Neuronale Maschinelle Übersetzung (NMT)

NMT wurde 2016 eingeführt. Es ist bis dato die erfolgreichste Übersetzungssoftware. Sie kann nicht nur damit angeben, dass es im Vergleich zu dem Vorgänger Statistical Machine Translation (SMT) die Fehlerquote um 60 Prozent verringern konnte, sondern sie ist auch wesentlich schneller.

Diese Verbesserungen beruhen auf dem künstlichen neuronalen Netzwerk des Systems. Es heißt, dass es auf dem Model der Neuronen im menschlichen Hirn basiert. Dieses Netzwerk macht es der Software möglich, kontextbezogene Verbindungen zwischen Wörtern und Phrasen zu ziehen. Sie kann diese Verbindungen ziehen, indem sie Sprachregeln lernt. Sie scannt Millionen von Sätzen ihrer Datenbank und identifiziert dabei Gemeinsamkeiten. Die Maschine nutzt dann die erlernten Regeln, um statistische Modelle zu schaffen, die ihr beim Verständnis helfen, wie ein Satz konstruiert sein muss.

Das künstliche neuronale Netzwerk

Ein Ausgangssatz wird in das Netzwerk eingegeben, dann an verschiedene versteckte Netzwerk-"Schichten" gesendet, bevor er schließlich in der Zielsprache zurückgesendet wird. | Alana Cullen | CC-BY-SA

Eine künstliche Sprache

Das bahnbrechende Feature von NMT ist die Erschaffung einer neuen Zahlensprache, die ihr bei der Übersetzung hilft.

Wenn man sich zum Beispiel die Phrase „To thine own self be true“ aus Shakespeares Hamlet anschaut. Die Maschine codiert jedes Wort in eine Zahl, in sogenannte Vektoren: 1, 2, 3, 4, 5, 6. Diese Zahlenreihe wird in das neurale Netzwerk eingespeist, wie hier links zu sehen. In diesen verborgenen Schichten passiert nun die „Magie“. Basierend auf den gelernten Sprachregeln findet das System nun die passenden Wörter in Deutsch. Die Nummern 7,8,9,10, 11 werden produziert und sie korrespondieren mit den Wörtern des deutschen Zielsatzes. Diese Nummern werden in die entsprechende Sprache entschlüsselt und das Resultat ist der Satz: „Zu dir selber treu sein.“

Im Prinzip übersetzt das System die Wörter in eine eigene Sprache und „denkt“ dann darüber nach, wie es, basierend auf Dinge, die es schon kennt, diese Wörter in einen verständlichen Satz überführen kann, wie es ein menschliches Hirn auch machen würde.

Kontext verstehen

NMT kann erfolgreich Literatur übersetzen, denn es versteht langsam, aber sicher den Kontext. Das System konzentriert sich nicht nur auf das zu übersetzende Wort, sondern auch auf die Wörter, die davor und dahinter auftauchen.

Wie ein Gehirn, das verschiedene Informationen entziffert, schaut sich auch dieses künstliche neuronale Netzwerk die Information an, die es bekommen hat und generiert das nächste Wort basierend auf dem Wort, das folgt. Mit der Zeit lernt es, auf welche Wörter es sich konzentrieren muss undbasierend auf den vorhandenen Beispielen,welcher Kontext entscheidend ist. Dieses Verfahren ist eine Art mehrschichtiges Lernen und es führt dazu, dass das System immer mehr lernt und sich ständig verbessert. Bei NMT wird das Entziffern von Kontext „Ausrichtung“ genannt, dies geschieht im Attention-Mechanismus, der im System zwischen Verschlüsselung und Entschlüsselung sitzt.

Anpassungsprozess. Die Anpassung findet durch die Aufmerksamkeitsmechanismen des künstlichen neuronalen Netzes statt und zieht Rückschlüsse auf den Kontext des Wortes. | Alana Cullen | CC-BY-SA Aber auch Maschinen sind nicht perfekt. Wenn die Shakespeare-Phrase vom Deutschen ins Englische zurückübersetzt wird, heißt es „Be true to yourself“, was nicht dem Ton der damaligen Tudor-Sprache zu Zeiten Shakespeares entspricht. Die literarische Wort-für-Wort-Übersetzung lautet „Sei deinem eigenen Selbst treu“, aber menschliche Übersetzer*innen neigen eher zu „Sei dir selbst treu“.

Von Menschen erzeugte Übersetzung. Sind Sätze von einem Menschen übersetzt, sind die Verknüpfungen viel komplexer als bei Übersetzungen von Künstlicher Intelligenz. Dies liegt daran, dass Menschen über ein höheres kontextuelles Verständnis verfügen. | Alana Cullen | CC-BY-SA Es ist aber schon spannend, wie Google Translate hier die Wichtigkeit von „treu“ im Kontext erkannt hat. Dass es gerade dieses Wort benutzt hat, beweist, dass Google Translate zwischen treu und wahr unterscheiden konnte. Das mehrschichtige Lernen bedeutet, dass ein falsch übersetzter Satz ein paar Wochen später zumindest zum Teil richtig übersetzt werden kann. (Vielleicht hat Google Translate seine Fehler bereits korrigiert, wenn dieser Artikel erscheint.)

Die ständige Verbesserung in Zusammenhang mit der ihm eigenen Sprache bedeutet, dass NMT angeleitet werden kann, sogenannte Zero-Shot-Übersetzungen durchzuführen. Das bedeutet, dass es eine Sprache gleich in mehrere andere Sprachen übersetzen kann, ohne Englisch als Zwischeninstanz zu nutzen. Wie bei Menschen scheint auch für Maschinen der Satz „Übung macht den Meister“ zu gelten.

Lost in Translation - Bei der Übersetzung abhanden gekommen

Auch wenn die maschinelle Übersetzung in den vergangenen Jahren schon weite Schritte vorangekommen ist, hat es immer noch nicht den literarischen Standard erreicht. Henry James betonte, wie wichtig es sei, den Text in seiner Originalsprache verstanden zu haben, als er bemerkte, der ideale literarische Übersetzer muss ein Mensch sein, „dem nichts entgeht“. Zumindest was Literatur betrifft, haben Maschinen noch einen weiten Weg vor sich, diesem Ideal zu entsprechen.

NMT hat bei literarischen Übersetzungen Probleme mit seltenen Wörtern, Eigennamen und komplizierter technischer Sprache. Nur 25-30 Prozent der Übersetzung erreicht den literarischen Standard. Eine entsprechende Studie, die sich mit der Übersetzung von Deutsch ins Englische befasste, fand heraus, dass das System zwar wenig Fehler in der Syntax machte, dafür aber oft keine adäquate Übersetzung für mehrdeutige Wörter fand. Trotz dieser Fehler war laut der Forscher*innen die Qualität der Übersetzung ausreichend, um die Geschichte zu verstehen und sich an ihr zu erfreuen. Eine andere Studie, die sich mit Übersetzungen von Englisch in die katalanische Sprache befasste, kam zu einem ähnlich guten Ergebnis. 25 Prozent von Muttersprachler*innen befand, dass die Qualität der maschinellen Übersetzung mit der einer menschlichen Übersetzung mithalten konnte.

Allerdings erzielt das Übersetzungssystem nicht immer so gute Erfolge. Bei manchen Sprachpaarungen hat es mit morphologisch reichen Sprachen, bei der Beugung und Tonfall wichtig ist zu kämpfen. Hier sind besonders die slawischen Sprachen betroffen. Dies fällt besonders auf, wenn von einer weniger komplexen Sprache in eine komplexere Sprache übersetzt werden soll. NMT kann deshalb noch nicht als globales Übersetzungswerkzeug benutzt werden.

Wie findet man den passenden Ton?

Die größte Herausforderung bleibt, den korrekten Ton und das passende Register für den zu übersetzenden Text zu finden. Peter Constantine, Direktor des literarischen Übersetzungsprogramms an der Universität von Connecticut, erklärte, dass die Maschinen den passenden Ton finden müssen, um Literatur erfolgreich übersetzen zu können.

„Was wird die Maschine nachahmen?“ fragt Constantine. „Wird es brillante und wunderschöne Foreignisation erschaffen oder eine großartige Domestication? Oder lässt sie Tschechows Sprache so erscheinen, als ob er seinen Text vor zehn Minuten in der Londoner U-Bahn geschrieben hätte?“

Welchen Ton wird eine Maschine wählen? Nehmen wir zum Beispiel das Werk des deutschen Nobelpreisträgers Thomas Mann. Sein Schreibstil veränderte sich mit den Jahren, zu Beginn waren seine Geschichten noch spielerischer als seine späteren schwereren Romane. Maschinen müssen diese Variationen erkennen, wenn ihre Übersetzungen die intendierte Bedeutung erfassen sollen.

Wichtige Zusammenarbeit

Es wird klar, dass die Maschine trotz all ihrer Bemühungen bei der spezifischen Doppeldeutigkeit von Worten und der Flexibilität von literarischer Sprache immer noch menschliches Management braucht. NMT kann menschliche Übersetzer*innen nicht ersetzen, kann aber als nützliches Werkzeug bei der Übersetzung von Literatur dienen.

Die Zusammenarbeit zwischen menschlicher und maschineller Übersetzung ist dabei wichtig. Eine Antwort für das Problem könnte die Nachbearbeitung einer maschinellen Übersetzung sein. Hier können professionelle Übersetzer*innen, die sich mit den Problemen von maschineller Übersetzung auskennen, die erste Fassung der maschinell erstellten Übersetzung redigieren – wie erfahrenere Kolleg*innen ihre noch nicht so erfahrenen Kolleg*innen unterstützen würden. Eine einfache Nachbearbeitung könnte kleinere Rechtschreibfehler und Grammatik verbessern, eine vertiefende Bearbeitung würde sich dann größeren Problemen wie Satzstruktur und Schreibstil widmen. Bei literarischen Übersetzungen ist eineNachbearbeitung Pflicht, damit auch der richtige Ton der Übersetzung gefunden wird. Eine Studie fand heraus, dass diese Methode bei einer Übersetzung eines gälischen Science-Fiction-Romans ins Irische um 31 Prozent schneller war als eine Übersetzung ohne die Hilfe einer Software. Außerdem erhöhte sich die Produktivität der Übersetzer*innen um 36 Prozent, wenn sie die maschinelle Übersetzung als Ausgangspunkt nutzen. Mit dieser Methode generierten sie 182 Wörter mehr pro Stunde.

Künstliche Intelligenz spielt eine immer größere Rolle in unserem Leben und man sollte sich dieses Übersetzungswerkzeug zunutze machen, um die Branche weiterzubringen. Die maschinelle Übersetzung hat einen weiten Weg hinter sich - von ihren Anfängenzu einem jetzigen Hilfswerkzeug. Die Software macht die lästige Kleinarbeit, während sich die Übersetzer*innen dem Feinschliff widmen können. Dies führt zu einer Entlastung der Übersetzer*innen, aber NMT ermöglicht auch die Übersetzung von Sprachen, die zuvor nie übersetzt wurden. Außerdem kann NMT dabei helfen, eine Sprache zu lernen. Wenn wir mit NMT zusammenarbeiten, können wir es als Lernwerkzeug nutzen, dass für alle einen besseren Zugang zur Literatur und Sprache ermöglicht.

Dieser Artikel erschien zum ersten Mal online als Teil eines Projekts des Goethe-Instituts Großbritannien zu künstlicher Intelligenz und literarischer Übersetzung.

Quellen:

Brownlee, J. 2017. A Gentle Introduction to Neural Machine Translation. [Accessed 9th July 2020].

Constantine, P. 2019. Google Translate Gets Voltaire: Literary Translation and the Age of Artificial Intelligence. Contemporary French and Francophone Studies. 23(4), pp. 471- 479.

Goldhammer, A. 2016. The Perils of Machine Translation. The Wire. [Accessed 14th July 2020].

Google Brain Team. 2016. A Neural Network for Machine Translation, at Production Scale. [Accessed 9th July 2020].

Gu, J., Wang, Y., Chu, K., Li. V. O. K. 2019. Improved Zero-shot Neural Machine Translation via Ignoring Spurious Correlations.arXiv. [Accessed 10th July 2020].

Iqram, S. 2020. Now you can transcribe speech with Google Translate. [Accessed 9th July 2020].

Jones, B., Andreas, J., Bauer, D., Hermann, K. M., and Knight, K. 2012. Semantics- Based Machine Translation with Hyperedge Replacement Grammars. Anthology. 12(1083), pp. 1359- 1376.

Kravariti, A. 2018. Machine Translation: NMT translates literature with 25% flawless rate. Translate Plus. [Accessed 14th July 2020].

Matusov, E. 2019. The Challenges of Using Neural Machine Translation for Literature. European Association for Machine Translation: Dublin, Ireland.

Maučec, M. S., and Donaj, G. 2019. Machine Translation and the Evaluation of Its Quality Recent Trends in Computational Intelligence. Intech Open.

Shofner, K. 2017. Statistical vs. Neural Machine Translation. ULG’s Language Solutions Blog. [Accessed 10th July 2020].

Systran. 2020. What is Machine Translation? Rule Based Translation vs. Statistical Machine Translation. [Accessed 9th July 202].

Toral, A., Wieling, M., and Way, A. 2018. Post-editing Effort of a Novel with Statistical and Neural Machine Translation. Frontiers in Digital Humanities. 5(9).

Turovsky, B. 2016. Ten years of Google Translate. [Accessed 9th July 2020].

Wong, S. 2016. Google Translate AI invents its own language to translate with. New Scientist. [Accessed 11th July].

Yamada, M. 2019. The impact of Google Neural Machine Translation on Post-editing by student translators. The Journal of Specialised Translation. 31, pp. 87- 95.

Zameo, S. 2019. Neural Machine Translation: tips and advantages for your digital translations. Text Master Go Global. [Accessed 14th July 2020].