Neue Medien und Digitalisierung

Immer besser, nicht perfekt – maschinelle Übersetzung

Die Übersetzungsprogramme werden immer besser.  Foto: Stuart Miles © iStockphotoDie Übersetzungsprogramme werden immer besser.  Foto: Stuart Miles © iStockphotoIn der globalisierten Welt müssen große Mengen an Texten übersetzt werden. Das übernehmen immer öfter Computer, mittlerweile kommen Übersetzungsprogramme zu erstaunlich guten Ergebnissen. Ganz ohne den Menschen geht es aber nicht.

Es ist nicht lange her, da fabrizierten die kostenlosen Online-Übersetzungsdienste von Yahoo oder Google noch radebrechende Übersetzungen. Seitdem ist einiges passiert. Der Google-Übersetzer liefert zwar zu dem englischen Satz „Rental prices have skyrocketed in Berlin this year“ mit „Mietpreise haben in Berlin schnellte in diesem Jahr“ immer noch ein enttäuschendes Ergebnis, der Online-Übersetzer der Firma Lingenio liegt dagegen völlig richtig: Mietpreise sind dieses Jahr in Berlin emporgeschnellt.

Wer benutzt das?

Mit einzelnen Sätzen tun sich die Übersetzungssysteme schwer.  Foto: anaken2012 © 123RF„Mit einzelnen Sätzen tun sich die Übersetzungssysteme ohnehin schwer, da nicht bekannt ist, zu welchem Sachgebiet sie gehören“, sagt der Computerlinguist Kurt Eberle, der an der Universität Heidelberg unterrichtet und mit der Firma Lingenio professionelle Übersetzungssoftware anbietet. Außerdem, so Eberle, seien nicht Privatpersonen die Zielgruppe von qualitativ hochwertigen Übersetzungssystemen, sondern Professionelle, wie Übersetzer oder international arbeitende Firmen, die regelmäßig übersetzen müssen. Vor allem von Deutsch nach Englisch. Dieses Sprachpaar, vermutet Eberle, benutzen rund 90 Prozent der Anwender von Übersetzungshilfen. Die Übersetzungssysteme sieht er als „Handwerkszeug“, das vor allem zur Unterstützung dient. Der Vorteil: Sie übersetzen sehr schnell sehr viel Text. Allerdings ist das Ergebnis nur eine Rohversion, die ein Mensch unbedingt weiter bearbeiten muss.

Grammatische Regeln oder statistische Berechnungen

Für die Übersetzungen vergleichen die Programme große Mengen von Text für das jeweilige Sprachpaar und zählen, wie oft bestimmte Wörter neben anderen stehen – etwa „ich“ neben „gehe“ und auf Englisch „I“ neben „go“. Es werden nicht nur einzelne Wortgruppen, sondern ganze Sätze gespeichert. Mit jeder neuen Übersetzung erhält das Programm neues Material, auf das es zugreifen kann. Je mehr man also übersetzt, desto besser wird das System.

Die Übersetzungssysteme, die in den 1990er-Jahren das lustige Kauderwelsch produzierten, arbeiten anders. Sie beziehen sich auf die Struktur einer Sprache. Dazu füttern Programmierer die Rechner mit Regeln zu Grammatik und Satzbau sowie mit dem Wortschatz einer Sprache. Da die Programme Wort für Wort übersetzen, versagen sie oft bei mehrdeutigen Wörtern. Ein Schloss kann ein Gebäude sein, sich aber auch in einer Tür befinden. Den passenden Kontext können diese Programme nicht feststellen.

Vorteil von Übersetzungssystemen: Sie übersetzen sehr schnell sehr viel Text. Foto: pachig © 123RFDie statistische Methode hat das Problem gelöst: Steht das Wort Schloss zusammen mit „wohnen“, dann muss es im Englischen „castle“ heißen, steht Schloss aber neben „reparieren“, wird es mit „lock“ übersetzt. Um verlässliche Übersetzungen zu bekommen, braucht man allerdings sehr viel Text. Und: Kommt ein Wort nicht oft genug in den Texten vor, wird es nicht richtig übersetzt. „Man braucht einen ausgewogenen Textkorpus aus verschiedenen Gebieten“, sagt Kurt Eberle. Doch das sei schwierig. „Es fehlen immer irgendwelche Bedeutungen.“

Mehr Text, bessere Übersetzungen

In den nächsten Jahren werden die Übersetzungsprogramme immer besser – das meint Martin Volk, Professor für Computerlinguistik an der Universität Zürich. „Im Internet gibt es immer mehr digitalisierte Übersetzungen von Menschen“, sagt er. Diese sind das perfekte Trainingsmaterial für die statistischen Übersetzungssysteme. Besonders hilfreich seien Websites, die in mehreren Sprachen existieren.

In naher Zukunft, so Volk, konzentriere man sich darauf, Systeme für bestimmte Anwendungsbereiche zu bauen, beispielsweise für Jura, Medizin oder die Autoindustrie. Mit der Spezialisierung steigt die Qualität der Übersetzung. Wenn sie auf Trainingsmaterial aus einem abgegrenzten Themenbereich basiert, sind die Ergebnisse besser als bei Google Translate, das mit Texten aus vielen Gebieten gefüttert wird.

Untertitel ja, Literatur nein

Literarische Werke bleiben weiter die Domäne des Menschen.  Foto: anaken2012 © 123RFEin Spezialgebiet von Martin Volk sind Untertitel. Für das schwedische Fernsehen haben er und seine Kollegen ein eigenes System entwickelt. „Das ist ein großer Erfolg“, sagt er. „Weil die Sätze kurz und knapp sind.“ Doch auch diese Rohübersetzung muss jemand nachkorrigieren. „Der Übersetzer ist aber trotzdem 20 bis 30 Prozent schneller als ohne Software.“ Sogar idiomatische Wendungen, an denen strukturbasierte Systeme scheitern, können die statistischen meistern. „He is out of his mind“ wird nicht mehr mit „Er ist außerhalb seines Geistes“ übersetzt, sondern korrekt mit „Er ist durchgeknallt“. Das aber nur, weil es ein Mensch einige Male korrekt übersetzt hat, und die Wendung im Textkorpus vorkommt.

Bei all diesen Erfolgen geht es vor allem um Gebrauchstexte. Literarische Werke bleiben weiter die Domäne des Menschen. „Sie sind eine Kunstform, davon lassen wir die Finger“, sagt Martin Volk, der sich sicher ist, dass in den nächsten 25 Jahren keine Maschine Harry Potter übersetzen wird. Schriftsteller benutzen schließlich seltene Wörter in seltenen Kombinationen. Und dafür haben statistische Systeme nicht genügend Vorlagen. „Die Regelsysteme schlagen sich hier besser“, meint Kurt Eberle. „Aber nur, wenn der Wortschatz gut gepflegt ist.“ Von den Maschinen auf Anhieb eine perfekte Übersetzung zu erwarten, sei sowieso eine Illusion, so Eberle. „Ein Übersetzer, der nicht vom Fach ist, muss sich für einen Juratext doch auch erst einlesen und einsprachige Wörterbücher ansehen.“ Genauso wie die Software eben.

Katja Hanke
ist Sprachwissenschaftlerin und freie Journalistin.

Copyright: Goethe-Institut e. V., Internet-Redaktion
Oktober 2012

Haben Sie noch Fragen zu diesem Artikel? Schreiben Sie uns!
internet-redaktion@goethe.de

Links zum Thema

SPRACH-SPRECH-FRAGEN-BOX

Welche Fragen und Ideen zur Zukunft der deutschen Sprache haben Sie?

Zeichnen Sie Ihre ganz persönliche Videobotschaft auf. In unserer Sprach-Sprech-Fragen-Box in einer von sechs Städten.
MEHR ...

MEDIENPARTNER

PARTNER