Koniec z lekcjami stacjonarnymi?
Sztuczna inteligencja w nauce języków obcych

Era sztucznej inteligencji zbliża się wielkimi krokami – widać to nie tylko po rosnącej popularności programów dialogowych typu Alexa. Jednak sztuczna inteligencja nieprędko zastąpi nauczycieli języków obcych – brakuje jej bowiem kluczowych cech takich jak spontaniczność, kreatywność i wspólny zasób wiedzy.
 

Dr Netaya Lotze

Sztuczna inteligencja z interfejsem obsługiwanym pisemnie lub ustnie w niedalekiej przyszłości będzie ułatwiać nam życie. Dzięki zaprogramowanym asystentom takim jak Siri (Apple) czy Galaxy (Samsung) już teraz można obsługiwać określone funkcje smartfona za pomocą programów rozpoznawania głosu oraz programom syntetyzującym. Program dialogowy Alexa (Amazon) wkrótce będzie zarządzał „smarthome’em“: w wizję przeszłości roztaczaną przez koncerny z Doliny Krzemowej wpisana jest również intuicyjna interakcja językowa z wirtualnym rozmówcą. Korzystamy ze sztucznej inteligencji nie tylko po to, by wydawać ustne polecenia smartfonowi lub odsłuchiwać playlisty, lecz również w scenariuszach znacznie bardziej złożonych, jak gry online, interaktywne zabawki z interfejsem językowym (np. Hello Barbie firmy Mattel) lub konsultacja z tutorem wirtualnym w ramach e-learningu (np. tutor Ed the Bot w programie szkoleniowym SAP). Wydaje się zatem, że wkrótce innowacyjne technologie będą odgrywały wielką rolę również w nauczaniu języków obcych. Umożliwiają one bowiem, przynajmniej teoretycznie, naukę w każdym miejscu i o każdej porze. Nad stworzeniem programów, które stosują (i łączą) zupełnie różne podejścia techniczne, pracują firmy komercyjne oraz niekomercyjne instytucje. Poniższy krytyczny przegląd tych programów pozwoli na lepszą orientację w temacie.

Podstawowe koncepcje techniczne w programach do nauki języka

Klasyczny graficzny interfejs użytkownika (+ rozpoznawanie mowy): uczący się danego języka rozwiązują rozmaite zadania podane w formie cyfrowej, zbliżone do tradycyjnych zadań z podręcznika do nauki języka. Na przykład przyporządkowują słówka obrazkom metodą drag and drop lub uzupełniają luki w tekstach. Ściśle rzecz biorąc jest to model, który nie podpada pod model sztucznej inteligencji, ponieważ działa na zasadzie klasycznej nauki na komputerze.

Z perspektywy psychologii nauczania problematyczne w tym modelu jest to, że nauka polega na żonglowaniu uprzednio sformułowanymi komponentami tekstowymi, co zupełnie wyklucza trening formułowania wypowiedzi spontanicznych według własnej inwencji. Na podobnej zasadzie działa wiele komercyjnych aplikacji do nauki języka, zarówno jednojęzycznych (Rosetta Stone), jak i wielojęzycznych (Babbel). Pod względem dydaktycznym wiodące na rynku aplikacje wzorują się na przestarzałych koncepcjach, takich jak metoda tłumaczeniowa lub tzw. pattern drills, ponieważ ich schematyczny format nie wiąże się z trudnościami technicznego modelowania.

Niektóre aplikacje posiadają również dodatkową funkcję rozpoznawania mowy, tzn. odpowiedzi użytkownika. Mowa nie zostanie rozpoznana, jeśli wymowa użytkownika jest nieprawidłowa. Funkcja ta nie może rzecz jasna zastąpić lekcji fonetyki, ponieważ w technicznej analizie danych dźwiękowych liczą się zupełnie inne kryteria niż chociażby prawdopodobieństwo wystąpienia tzw. łańcuchów dźwięków. Oznacza to, że na rozpoznawanie mowy mają wpływ takie czynniki jak niewyraźna wymowa, szept lub dźwięki towarzyszące. Poza tym aplikacje nie dysponują funkcją indywidualnego feedbacku w odniesieniu do artykulacji. Jeśli więc użytkownik raz za razem powtarza odpowiedź prawidłowo, lecz przy interferencji dźwięków towarzyszących każdorazowo otrzymuje komunikat o udzieleniu błędnej odpowiedzi, może to przyczynić się nie tyle do poprawy wymowy, ile do frustracji użytkownika.
 
Interfejs językowy z funkcją dialogową: W tym przypadku chodzi o próbę symulacji naturalnej interakcji językowej za sprawą tutora wirtualnego, którego można określić sztuczną inteligencją w sensie ścisłym. Te systemy dialogowe funkcjonują na zasadzie prostego chatbota, który ma pomóc w stworzeniu efektu intuicyjnej komunikacji w języku zbliżonym do naturalnego. Uczący się mają wolność formułowania własnych wypowiedzi, które z kolei są sprawdzane pod kątem obecności uprzednio ustalonych słów kluczowych. Jeśli w wypowiedzi uczącego się pojawiło się prawidłowe słowo kluczowe, wówczas z puli odpowiedzi tutora zostaje wybrana pasująca, uprzednio sformułowana reakcja językowa. Wypowiedzi można formułować pisemnie lub ustnie. Wersja anglojęzyczna aplikacji do nauki języka Duolingo posiłkuje się na przykład wirtualną tutorką w postaci pisemnego chatbota. Problem w tym, że większość systemów reaguje tylko na proste słowa kluczowe i ma spore trudności z oceną poprawności gramatycznej lub sytuacyjnej wypowiedzi użytkownika. Taki interaktywny sztuczny tutorial sprawdza się w jasno określonych scenariuszach z przewidywalnymi dialogami i listami błędów. Taki tutorial może co jakiś czas informować o postępach w nauce, zadawać pytania i formułować feedback. W nauczaniu języków obcych programy te nie znajdują jednak jeszcze takiego zastosowania, jakie obiecywałby kryjący się w nich potencjał. Wyjątkiem jest kształcenie uniwersyteckie, na przykład e-tutorial w dziedzinie germanistycznej lingwistyki, gramatyki i ortografii na Uniwersytecie Leibniza w Hanowerze, z uroczym sztucznym tutorem o imieniu El Lingo.
 
Wirtualne kursy z pedagogicznym programowaniem tzw. agentowym: Najbardziej zaawansową technologią są systemy dialogowe z kosztownymi awatarami, posiadającym gestykulację i mimikę (embodiment). Na przykład na Uniwersytecie Bielefeld stworzono pedagogiczny program agentowy o imieniu Max, który jest wirtualnym przewodnikiem po muzeum. Można z nim rozmawiać o eksponatach – pod warunkiem, że jesteśmy kooperatywni i ściśle trzymamy się uprzednio przygotowanych skryptów dialogowych. Problematyczny dla uczącego się języka obcego jest w tym scenariuszu fakt, że interakcja z programem agentowym przebiega bez zakłóceń tylko wtedy, gdy użytkownik udziela takich odpowiedzi i zadaje takie pytania, jakie przewidzieli twórcy programu. A ludzkie zachowanie daje się przewidzieć tylko częściowo. Oprócz gotowych skryptów problemem są dialogi z chatbotami i programami agentowymi - niekonsekwentne, niespójne i podatne na zakłócenia. Nie mogą więc służyć jako wzór dla uczących się nowego języka.

Człowieka nie da się skopiować – jego języka też nie
Człowieka nie da się skopiować – jego języka też nie | Foto: © Colourbox
Analizy „big data”: W ostatnim czasie efektywność sztucznej inteligencji mocno wzrosła, również dlatego że wzrosły możliwości związane z zapisywaniem dużych ilości danych. Analiza dużych ilości danych poprzez algorytm i modele statystyczne może zostać wykorzystana również w nauce języków, na przykład w tłumaczeniach i słownikach opartych na korpusach językowych. Zaletą pracy z dużą ilością danych zawierających empiryczne wypowiedzi native speakerów jest to, że użytkownicy nie uczą się języka jako abstrakcyjnego systemu, lecz na podstawie autentycznego uzusu językowego. Problem tkwi natomiast w tym, że w celu analizy danej informacji trzeba się zdać na uprzednio zdefiniowany algorytm, który nie zawsze szuka i znajduje to, co obiecał. Korzystanie z dużej ilości danych mogłoby również poprawić funkcjonowanie systemów dialogowych, takich jak Watson (IBM). W tym celu systemy musiałyby one jednak zapisywać każdy dialog, co budzi poważne zastrzeżenia z punktu widzenia ochrony danych osobowych i powinno zostać wzięte pod uwagę przy korzystaniu z tej metody podczas lekcji języka.

Potencjał i granice sztucznej inteligencji

W czym należałoby upatrywać potencjału sztucznej inteligencji, a w czym jej granic? Problemem z punktu widzenia interakcji jest to, że systemy sztucznej inteligencji są skonstruowane deterministycznie, to znaczy podporządkowane jednemu programowi. Ponadto mają możliwość odwołania się tylko do ograniczonych zasobów wiedzy, na przykład społecznej czy kulturowej. Natomiast komunikacja międzyludzka funkcjonuje dokładnie odwrotnie – zakładamy, że nasz rozmówca ma podobny zasób wiedzy co my, toteż komunikujemy w danej sytuacji tylko to, co uważamy za istotne dla tej konkretnej interakcji. Możemy też zachowywać się spontanicznie i elastycznie. Systemy nie dysponują spontanicznością ani elastycznością, ponieważ brak im zasadniczej właściwości ludzkiej: świadomości poznawczej. Dlatego możliwe, że programy do e-learningu z graficznym interfejsem już wkrótce wyprą tradycyjne analogowe podręczniki do nauki języka – natomiast osoba nauczyciela lub nauczycielki w najbliższej przyszłości nie zostanie raczej zastąpiona sztuczną inteligencją. Programy do e-learnigu ze sztucznymi tutorami nie zastąpią lekcji stacjonarnych z prawdziwym nauczycielem, mogą natomiast stanowić zupełnie nową i odrębną jakość – uzupełnienie samodzielnej nauki. Powtarzanie słówek razem z pedagogicznym programem agentowym lub rozwiązywanie językowych zadań w ramach gry komputerowej z wirtualnymi bohaterami to dla niektórych typów uczniów niezwykle motywujący scenariusz. Inni z kolei uczą się lepiej w ramach społecznej interakcji w rzeczywistej grupie, w której zachodzi typowa dla niej dynamika, łącznie ze sprawdzaniem postępów przez rzeczywistego nauczyciela lub nauczycielkę.

Interaktywne systemy nauki języka wypełniają lukę – dzięki nim osoby pracujące zawodowo, które nie mają czasu na regularny kurs językowy, mogą z pomocą aplikacji językowych opanować proste zdania, by porozumieć się w obcym języku na przykład na urlopie. A uchodźcy mogą przyswajać sobie słownictwo podstawowe poprzez aplikacje DaF [Deutsch als Fremdsprache – Język niemiecki jako obcy] lub aplikacje Goethe-Institut, skracając sobie długi czas oczekiwania na uczestnictwo w kursie integracyjnym. Wymienione technologie nadają się więc wyłącznie dla początkujących w ramach uzupełnienia lekcji stacjonarnych z rzeczywistym nauczycielem lub nauczycielką albo podczas przygotowania do nich.
 

Literatura

Lotze, Netaya (2016): Chatbots. Eine linguistische Analyse (Sprache – Medien – Innovation; 9).