Schnelleinstieg:

Direkt zum Inhalt springen (Alt 1) Direkt zur Hauptnavigation springen (Alt 2)

Künstliche Intelligenz im Fremdsprachenunterricht
Die Korrektur von Texten beim Sprachenlernen bleibt Handarbeit

Hand mit Rotstift korrigiert Text
Sinnvolle Korrektur erfordert Fachkompetenz und Fingerspitzengefühl | © Getty Images

„Hochwertige Texte auf Knopfdruck“ lautet das Versprechen zahlreicher Anbieter digitaler Schreibassistenten. Maschinelle Systeme sind mittlerweile in der Lage, augenblicklich umfassende Textkorrekturen und Verbesserungsvorschläge zu generieren. Doch wie gut sind diese Korrekturen wirklich und helfen sie Lernenden einer Fremdsprache dabei, selbst gute Texte zu verfassen?

Von Dr. Moritz Dittmeyer

Wozu noch Fremdsprachen lernen, ließe sich angesichts der Vielzahl an neuen Sprachtechnologien und digitalen Unterstützungstools im Internet fragen. Intelligente Anwendungen übersetzen unsere Texte binnen Millisekunden (DeepL, Google Translate) oder unterstützen dabei, selbst fehlerfrei und mit hochwertigem Stil Texte zu verfassen: sei es die Autokorrekturfunktion in der Office-Anwendung und dem Browser unserer Wahl oder umfassendere Assistenten wie etwa der Duden-Mentor, Grammarly oder das LanguageTool.

Viele Anbieter sogenannter Schreibassistenten werben damit, uns in jeder Lebenslage mit besseren Texten zu beglücken und damit erfolgreicher zu machen. Sowohl die Prüfung von Rechtschreibung, Grammatik und Zeichensetzung als auch eine stilistische Optimierung der Texte oder das Umformulieren ganzer Sätze gehören zum Repertoire entsprechender Anwendungen.

Liegt es somit nicht auf der Hand, diese neuen Korrekturassistenten auch beim Sprachenlernen zu verwenden? Und brauchen wir hier überhaupt noch ausgebildete Lehrkräfte, wenn die Korrekturen und Verbesserungsvorschläge maschineller Anwendungen viel schneller, akkurater und objektiver sind, wie doch an mancher Stelle gerne proklamiert wird?

Das LanguageTool auf dem Prüfstand

So einfach ist das nicht, hat eine Untersuchung am Goethe-Institut mit Wissenschaftler:innen der Humboldt-Universität zu Berlin ergeben: Aktuelle Autokorrekturtools mögen zwar Muttersprachler:innen oder bereits weit fortgeschrittene Sprachlernende dabei unterstützen, bessere Texte zu erzeugen. Ein sinnvolles Werkzeug, um zu lernen gute Texte zu schreiben, stellen sie insbesondere für Anfänger:innen jedoch nicht dar. Nur mit weitreichenden Anpassungen sind Autokorrekturtools didaktisch und von der Qualität her hier zu empfehlen.
 
Das LanguageTool
Gegenstand der Studie war das LanguageTool: eine open-source Anwendung für Grammatik-, Stil- und Rechtschreibprüfung für zahlreiche verschiedene Sprachen, die aufgrund ihres offenen Quellcodes die Basis vieler im Netz auffindbarer Korrekturanwendungen darstellt. Mittlerweile hat sich das LanguageTool zu einem vollmundigen Schreibassisten entwickelt, der erst in einer Bezahlvariante sein volles Potential entfaltet und eigenen Aussagen nach, von Millionen Menschen weltweit genutzt wird. Um das LanguageTool herum existiert eine aktive Gemeinschaft, die die Anwendung kontinuierlich verbessert. Für die deutsche Sprache umfasst die aktuelle Version aktuell über 4500 Regeln in den Kategorien Grammatik, Zeichensetzung, Rechtschreibung, Typografie, Redewendungen, Geschlechtergerechte Sprache und mehr.
 

Das Experiment

Im direkten Vergleich mit den Lehrkräften des Goethe-Instituts fiel das LanguageTool durch seine Ungenauigkeit auf. Es markierte in Texten Sprachlernender aus Onlinekursen des Goethe-Instituts der Stufe A2 deutlich mehr Fehler als die an der Studie beteiligten Tutor:innen. Hierbei handelte es sich häufig um Fehler, die keine sind, oder um irrelevante Fehler, wie z.B. Eigennamen oder andere fälschlicherweise als fehlerhaft identifizierte Satzfragmente und Dinge die dem Kenntnisstand der Lernenden noch gar nicht entsprachen. Bei komplexeren Grammatikfehlern hingegen war das Gegenteil zu beobachten. Gerade Satzbaufehler wurden kaum registriert, was insgesamt zu einer sehr schlechten Trefferquote führte.

Verantwortlich für die geringe Genauigkeit und schlechte Trefferquote des LanguageTools sind die technologischen Ansätze, wenn es um die Identifikation von Grammatikfehlern geht, sowie die fehlende Bedeutungsebene bei regelbasierten Korrekturen. So müsste eine sinnvolle Korrekturanwendung auch semantische oder kontextbezogene Informationen berücksichtigen, um etwa Eigennamen treffsicher als solche zu erkennen und eben nicht zu korrigieren.

Beispiel eines vom LangugeTool korrigierten Texts einer Sprachlernenden. Beispiel eines vom LangugeTool korrigierten Texts einer Sprachlernenden. | © Goethe-Institut

Korrektives Feedback beim Fremdsprachenlernen

Tatsächlich erweist sich die Situation als noch komplexer. Naturgemäß geht es beim Fremdsprachenlernen um das Lernen einer neuen Sprache. Texte zu korrigieren umfasst somit auch eine didaktische Komponente. Das optimale korrektive Feedback hängt dabei von der spezifischen Situation der Lernenden und ihres Lerntyps ab. Es kann fokussiert und implizit, aber auch allumfassend und explizit erfolgen. Indem eine Lehrkraft sich bei der Korrektur etwa auf bestimmte Fehlertypen konzentriert, kann sie die Lernenden auf ein bestimmtes Problem aufmerksam machen. Implizite Korrekturen können den Effekt haben, Lernende zu motivieren, sich selbst mit den im Hintergrund stehenden Regeln zu beschäftigen. Die von uns befragten Lehrkräfte bemängelten besonders diese didaktischen Unzulänglichkeiten bei den Korrekturen und Verbesserungen des LanguageTools. Außerdem wurde immer wieder betont, dass falsch identifizierte Fehler und falsche Korrekturvorschläge für Sprachlernende besonders problematisch sind, da sie nicht in der Lage sind, diese als falsche Hinweise zu erkennen. Auch motivationspsychologische Faktoren darf man nicht außer Acht lassen. Zu viele und ganz besonders falsche Korrekturen können sich demotivierend auf das Lernverhalten auswirken. 

Fazit & Ausblick

Ohne umfassende und spezifische Anpassungen auf den Bereich des Deutsch als Fremdsprachenlernens ist die Technologie hinter dem LanguageTool kaum für eine angemessene Korrektur von Freitexten Deutschlernender geeignet.

Neben regelbasierten Ansätzen gibt es seit einigen Jahren auch die Möglichkeit, mit sogenannten Sprachmodellen Textkorrekturen und –Verbesserungen vorzunehmen. Mit Sprachmodellen sind hier komplexe vortrainierte neuronale Netzwerkarchitekturen gemeint, die in der Lage sind, eine Sprache in ihrer Gesamtheit zu modellieren. Das Besondere dabei: Sprachmodelle sind aufmerksam. Sie verfügen über ein gewisses Maß an Verständnis, indem sie den verarbeiteten Wörtern oder Wortfragmenten Bedeutung und Kontext zuweisen.

Bei der Entwicklung von Sprachmodellen wurden zuletzt immer wieder Rekorde gebrochen und tatsächlich sind diese Netzwerkarchitekturen erstaunlich gut darin, natürliche Sprache zu „verstehen“, zu manipulieren und nachzuahmen. Eines der berühmtesten Sprachmodelle ist der Generative Pretrained Transformer 3 (GPT-3) der US-amerikanischen Organisation OpenAI.

Doch für den Einsatz bei Korrektur und Verbesserung von Texten Sprachlernender müssten auch sie aufwändig angepasst werden. Einsatzbereite, umfassende Sprachmodelle existieren derzeit primär für die englische Sprache. Eine gängige Praxis, um Textkorrekturen im Deutschen vorzunehmen, besteht darin, Texte erst ins Englische zu übersetzen, dort zu verbessern und sie dann wieder ins Deutsche zurück zu übersetzen. Das führt jedoch dazu, dass die Texte im Laufe der verschiedenen Prozessschritte mitunter spürbar verfremdet werden, und Wörter, Redemittel und grammatikalische Strukturen enthalten, die Sprachlernende noch gar nicht kennen.

Hinzu kommt, dass Sprachmodelle auf einen idealen bzw. normalen Sprachgebrauch hin trainiert wurden und deshalb didaktisch nicht differenziert korrigieren können. Vorgeschlagene Korrekturen und Verbesserungen sind somit häufig für Sprachlernende auf einem niedrigen Sprachlernniveau gar nicht sinnvoll, da hier, wie oben erwähnt, nicht nur ein idealer Sprachgebrauch, sondern auch andere Faktoren eine Rolle spielen.

Beispiel eines durch ein Sprachmodell optimierten Texts einer Sprachlernenden (GPT-NeoX 20B via https://nlpcloud.com) Beispiel eines durch ein Sprachmodell optimierten Texts einer Sprachlernenden (GPT-NeoX 20B via https://nlpcloud.com) | © Goethe-Institut Zudem besteht bei Sprachmodellen die Gefahr, nicht mehr nachvollziehen zu können, warum eine bestimmte Korrektur oder Verbesserung erfolgt. Im Gegensatz zu regelbasierten Ansätzen gibt es keine spezifizierbaren Regeln, die eine Schlussfolgerung zu den Hintergründen erlauben, sondern die Korrekturen basieren –vereinfacht ausgedrückt – darauf, was insgesamt gesehen in dem jeweiligen Kontext statistisch am wahrscheinlichsten ist. Ein als falsch identifiziertes Satzzeichen oder Wort wird ersetzt, durch dasjenige Satzzeichen oder Wort, was im spezifischen Kontext des Satzes und Textes am häufigsten vorkommt.

Mit Blick auf die Nachhaltigkeit bleibt zu erwähnen, dass der Gebrauch von Sprachmodellen eine ressourcenintensive Angelegenheit ist. Entwicklung, Training und Betrieb von den großen vortrainierten Sprachmodellen wie etwa dem berühmten GPT-3 verschlingt um die Tausend Megawatt an Strom, kostet Millionen und benötigt Milliarden an Datenpunkten.

Die Korrektur von Texten Sprachlernender auf eine angemessene und didaktisch sinnvolle Art und Weise wird somit bis auf Weiteres Aufgabe von ausgebildeten Lehrkräften bleiben.

Zweifel?

Dann probieren sie es selbst aus. Hier finden sie zwei anonymisierte Texte Sprachlernender, die Sie mit der Sprachassistent:in Ihrer Wahl überprüfen können.
 

Hallo Kadira. Mein Traum haus hat eine großküche, ein groß und hell bad mit ein groß Spiegel. Mein Slafszimmer hat einen groß bett, viel Schranks, Meinen Arbeitzimmer hat einen Bibliothek, einen Tisch für den Computer un ein bequemer Stuhl. Sie hat auch ein großer und farbenfroher Garten. Mit Freundlichen Grüßen, Tho

Liebe Taisha. Das ist meine Tag. Jeden Morgen ich aufstehe um 5:30 Uhr und ich zaubere den Frühstück für mich und meine Tochter Khaleesi. Dann ich arbeite bis 16 Uhr. ; Von 16:15 bis 18:45 spiele ich mit Khaleesi, um 19 Uhr haben wir das Abendessen und ich vorbereite Khaleesi für das Bett um 8 Uhr. Sie habe ein Bad und sie schlaft von 21 Uhr. Dann ich arbeite, zaubere die Essen für den Morgen oder ich lerne Deutsch. Es kann helfen um eine Kultur besser zu verstanden, und auch um mehrere Leute zu können lernen. Viele Grüße, Sichin

Quellen

Sylvio Rüdian, Moritz Dittmeyer, und Niels Pinkwart (2022): Challenges of using auto-correction tools for language learning. In LAK22: 12th International Learning Analytics and Knowledge Conference (LAK22). Association for Computing Machinery, New York, NY, USA, 426–431. https://doi.org/10.1145/3506860.3506867

Nassaji, H., & Kartchava, E. (Herausgeber) (2021): The Cambridge Handbook of Corrective Feedback in Second Language Learning and Teaching (Cambridge Handbooks in Language and Linguistics). Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108589789

Top