Präsenzunterricht ade?
Künstliche Intelligenz fürs Sprachenlernen

Smart speaker
© GettyImages.com

Künstliche Intelligenzen sind auf dem Vormarsch – was sich nicht nur an der zunehmenden Beliebtheit von Dialog-Software wie Alexa ablesen lässt. Doch um beim Sprachunterricht reale Lehrpersonen ablösen zu können, fehlen entscheidende Kriterien: Spontanität, Kreativität und geteiltes Wissen.

Von Dr. Netaya Lotze

Sie sollen in Zukunft unseren Alltag erleichtern – künstliche Intelligenzen (KIs) mit schriftlich oder mündlich bedienbarem Sprachinterface. Durch Assistenzsysteme wie Siri (Apple) oder Galaxy (Samsung) lassen sich unter Einsatz von Spracherkennungs- und Synthese-Software Funktionen auf dem Smartphone bedienen, die Dialog-Software Alexa (Amazon) steuert schon bald das Smarthome: Silicon-Valley-Konzerne zeichnen eine Zukunftsvision, aus der die intuitive sprachliche Interaktion mit dem virtuellen Gegenüber nicht mehr wegzudenken ist. Und KIs werden nicht nur eingesetzt, um mündlich dem Handy den Befehl zu geben eine Playlist abzuspielen, sondern in wesentlich komplexeren Szenarien wie Online-Spielen, interaktivem Spielzeug mit Sprachinterface (wie Mattels Hello Barbie) oder als virtuelle Tutoren in E-Learning-Umgebungen (etwa als virtueller Tutor Ed the Bot in einer Lernsoftware zu SAP). Es liegt also nahe, innovative Technologien auch für den Fremdsprachenunterricht nutzbar zu machen. Sie sollen das Lernen überall und jederzeit ermöglichen. Dabei werden von kommerziellen Anbietern und nicht-kommerziellen Institutionen Anwendungen entwickelt, die völlig verschiedene technische Herangehensweisen verfolgen (und kombinieren). Eine kritische Übersicht, wie sie im Folgenden unternommen wird, kann hier zur Differenzierung beitragen.

Technische Basiskonzepte für Sprachlernsoftware

Die klassische grafische Benutzeroberfläche (+ Spracherkennung): Hier klicken sich Sprachlernende durch digitale Aufgaben, die stark an traditionelle Übungsbücher erinnern. Per Drag-and-drop werden Vokabeln Bildern zugeordnet oder Lückentexte ausgefüllt. Solche Lernumgebungen fallen streng genommen gar nicht in den Bereich der KI-Forschung, weil sie sich an einer klassischen Desktop-Umgebung orientieren.

Problematisch aus lernpsychologischer Perspektive ist hier, dass vor allem vorformulierte Textbausteine hin- und hergeschoben werden und die kreative, spontane Formulierung eigener Gesprächsbeiträge kaum trainiert wird. Viele der kommerziellen Sprachlern-Apps funktionieren so – teilweise einsprachig (Rosetta Stone), teilweise mit Übersetzungen (Babbel). Didaktisch orientieren sich auch die Marktführer unter diesen Apps an veralteten Konzepten wie der Übersetzungsmethode oder Pattern-Drills, denn stark schematische Formate können bedeutend einfacher technisch modelliert werden.

Erweitert werden einige der Apps durch Spracherkennungssoftware, die eingesprochene Lösungen erkennt  – oder auch nicht: bei falscher Aussprache. Diese Funktion ersetzt selbstverständlich keinen Phonetik-Unterricht, da bei der technischen Auswertung von Audio-Daten ganz andere Kriterien relevant werden wie etwa die Bewertung der Wahrscheinlichkeit von Lautketten. So kann die Spracherkennung durch undeutliche Aussprache, Flüstern oder Nebengeräusche beeinflusst oder von den Lernenden gezielt getäuscht werden. Außerdem geben die Apps kein individuelles Feedback zur Artikulation. Wiederholtes Einsprechen mit prompter Fehlermeldung führt daher eher zur Frustration als zur Verbesserung der Aussprache.
 
Sprachinterface mit Dialogfunktion: Hierbei handelt es sich um den Versuch, natürlich-sprachliche Interaktion mit einem virtuellen Tutor oder einer Tutorin zu simulieren, der/die im engeren Sinne als KI bezeichnet werden kann. Diese Dialogsysteme folgen dem Prinzip des einfachen Chatbots, mit dessen Hilfe intuitiv in natürlicher Sprache kommuniziert werden soll. Die Lernenden können Gesprächsbeiträge frei eingeben, die von der Technologie auf vordefinierte Schlüsselwörter geprüft werden. Wurde das richtige Schlüsselwort verwendet, wird ein passender, vorformulierter Gesprächsbeitrag des künstlichen Tutors ausgewählt und ausgegeben. Die Sprach-Ein- und Ausgabe kann schriftlich oder mündlich erfolgen. Die englischsprachige Version der Sprachlern-App Duolingo arbeitet beispielsweise mit einem schrift-basierten Chatbot als Tutorin. Problematisch dabei ist, dass die meisten Systeme allein auf einfache Schlüsselwörter reagieren und große Probleme mit der Bewertung der grammatikalischen Korrektheit oder gar der situativen Angemessenheit einer Eingabe haben. Solche interaktiven artifiziellen Tutorensysteme funktionieren in klar umrissenen Szenarien mit vorhersehbaren Dialogen und entsprechenden Fehlerquellen. In diesen Kontexten können sie mit vorgegebener (idealerweise stufenweise wählbarer) Progression Lerninhalte vermitteln, Fragen stellen und Feedback geben. In der Fremdsprachenvermittlung findet diese Technologie allerdings längst nicht die Anwendung, die ihr Potenzial verspricht. In der universitären Lehre kommt sie dagegen bereits teilweise zum Einsatz, wie in den E-Tutorien zur germanistischen Linguistik, Grammatik und Orthografie mit dem charmanten artifiziellen Tutor El Lingo an der Leibniz Universität Hannover.
 
Virtuelle Lernumgebungen mit pädagogischen Agenten-Systemen: Dialogsysteme mit aufwendigen Avataren inklusive Gestik und Mimik (Embodiment) stellen die am weitesten fortgeschrittene Entwicklung dar. So wird an der Universität Bielefeld der pädagogische Agent Max als virtueller Museumsführer entwickelt. Mit ihm kann man sich über die Exponate unterhalten – sofern man sich kooperativ verhält und von den klar vordefinierten Dialogskripts nicht abweicht. Problematisch für den Fremdsprachenunterricht ist, dass die Interaktion mit dem Agentensystem nur dann störungsfrei verläuft, wenn die Lernenden die Fragen und Antworten eingeben, die die Systementwicklerinnen und -entwickler vorhersehen konnten. Menschen sind aber in ihrem Verhalten nur bedingt vorhersehbar. Außerhalb der geskripteten Anwendungsbereiche sind Dialoge mit Chatbots und Agentensystemen sprunghaft, inkohärent und störungsanfällig. Als Vorbild für Fremdsprachenlernende können sie nicht dienen.

Der Mensch bleibt unnachahmlich - ebenso wie seine Sprache
Der Mensch bleibt unnachahmlich - ebenso wie seine Sprache | Foto: © Colourbox
Big-Data-Analysis: Die Effizienz der KIs ist in jüngerer Zeit nicht zuletzt aufgrund der massiven Ausweitung der Datenspeicherung stark gestiegen. Die Auswertung großer Datenmengen qua Algorithmus und statistischen Modellen kann auch für den Fremdsprachenunterricht nutzbar gemacht werden, beispielsweise für Übersetzungsaufgaben und in Form von korpus-basierten Lexika. Vorteil der Arbeit mit großen Datensammlungen mit empirischen Äußerungen von Muttersprachlerinnen und Muttersprachlern ist, dass die Fremdsprache nicht als abstraktes System erlernt wird, sondern so, wie sie tatsächlich im Gebrauch ist. Problematisch ist andererseits, dass man sich zur Auswertung der Information auf den vordefinierten Algorithmus verlassen muss, der nicht immer das sucht und ausgibt, was er verspricht. Durch Rückgriff auf große Datenmengen sollen auch Dialogsysteme wie Watson (IBM) verbessert werden. Dafür zeichnen die Systeme jeden Dialog auf, was unter datenschutzrechtlichen Aspekten als äußerst bedenklich einzustufen ist und in naher Zukunft bei der Nutzung im Unterricht bedacht werden sollte.

Potenziale und Grenzen Künstlicher Intelligenzen

Worin liegen nun Potenziale und Grenzen der KIs? Problematisch für die Interaktion ist, dass die Systeme rein deterministisch angelegt sind, also einem Programm folgen und nur auf geringe Wissensressourcen wie soziales oder kulturelles Wissen zurückgreifen können. Menschliche Kommunikation funktioniert genau umgekehrt. Wir setzen sehr viel geteiltes Wissen voraus und kommunizieren äußerst effizient nur das, was wir als relevant für eine spezielle Interaktionssituation erkennen. Dabei können wir spontan und flexibel agieren. Die Systeme können das nicht, denn Ihnen fehlt eine grundsätzliche Voraussetzung: das kognitive Bewusstsein. Daher werden zwar E-Learning-Anwendungen mit grafischer Benutzeroberfläche unter Umständen in Zukunft analoge Lehrbücher ablösen, aber die Lehrperson wird in absehbarer Zeit nicht von einer KI ersetzt. E-Learnig-Anwendungen mit künstlichen Tutorinnen und Tutoren ersetzen nicht den Präsenzunterricht, sondern stellen eine völlig neue Herangehensweise an die Unterstützung zum Selbststudium dar. Vokabeln interaktiv mit einem pädagogischen Agentensystem zu trainieren oder in einem Computerspiel mit virtuellen Charakteren Sprachübungen zu absolvieren, stellt für einige Lernertypen ein äußerst motivierendes Szenario dar. Andere lernen besser über die soziale Interaktion in einer realen Lerngruppe mit den daraus resultierenden Verbindlichkeiten wie der Kontrolle des Lernfortschritts durch eine reale Lehrperson.

Interaktive Sprachlernsysteme füllen auch dort sinnvoll eine Lücke, wo ansonsten gar kein Unterricht stattfinden würde. So können Berufstätige, die keine Zeit haben einen regulären Kurs zu besuchen, mit Lern-Apps einfache Sprachkenntnisse für den Urlaub erwerben. Oder Geflüchtete in Notsituationen über DaF-Apps wie der des Goethe-Instituts einen Grundwortschatz aufbauen, während sie die langen Wartezeiten für die Integrationskurse überbrücken. Die Technologien eignen sich also ausschließlich für Anfängerinnen und Anfänger als Ergänzung oder Vorbereitung für den Präsenzunterricht mit einer menschlichen Lehrkraft.
 

Literatur

Lotze, Netaya (2016): Chatbots. Eine linguistische Analyse (Sprache – Medien – Innovation; 9).

Top