Intel·ligència artificial en l'ensenyament de llengües estrangeres
EL SOFTWARE BASAT EN INTEL·LIGÈNCIA ARTIFICIAL S'OBRE CAMÍ EN L'ENSENYAMENT DE LLENGÜES ESTRANGERES
La tecnologia basada en IA la trobem a tot arreu, i avui dia costa imaginar l'ensenyament de llengües sense ella. Ens endinsem en l'àrea del processament del llenguatge natural i en els possibles usos (i abusos) de les eines d'intel·ligència artificial a l'aula.
Avui dia ensopeguem ara i adés amb tecnologies basades en la intel·ligència artificial (IA) en molts àmbits de la nostra vida: des d'anuncis i resultats de cerca personalitzats en Internet fins al reconeixement facial per desbloquejar el mòbil, passant pels assistents de veu i els dispositius domèstics intel·ligents. També en les classes de llengües estrangeres veiem que aquestes eines són cada vegada més populars. Aquí ens centrarem en dues àrees del processament del llenguatge natural: la traducció automàtica i la generació automàtica de textos.
El processament del llenguatge natural és una disciplina conjunta de la lingüística, la informàtica i la recerca en IA. El seu objectiu és que els ordinadors "entenguin" el llenguatge parlat o escrit i així poder utilitzar-los en tasques com l'anàlisi i generació de textos, la traducció automàtica i el reconeixement de la parla. Per a això són indispensables uns algorismes capaços de trobar i reconèixer patrons en una quantitat colossal de dades no estructurades: les anomenades xarxes neuronals.
LES TRADUCCIONS HUMANES JA GAIREBÉ NO ES DISTINGEIXEN DE LES AUTOMÀTIQUES
El software de traducció automàtica s'ha consolidat en l'ensenyament de llengües estrangeres. Quan no entenen una paraula o una frase, els i les alumnes treuen intuïtivament el mòbil per investigar-ne el significat. A diferència dels pesants diccionaris convencionals, el mòbil el tenim sempre a mà, i buscar-hi informació és molt més ràpid. També hi ha alumnes que utilitzen els programes de traducció automàtica per traduir a un altre idioma textos que han escrit en la seva llengua materna.Si fa uns anys podíem reconèixer de seguida quins textos havien estat traduïts automàticament, la recerca en el camp de la tecnologia de la traducció ha avançat tant en l'última dècada, que actualment és gairebé impossible saber si una traducció l'ha feta un humà o un ordinador. El professorat és ben conscient d'aquesta tendència, sobretot quan un alumne o alumna produeix textos mediocres a classe, però porta de casa uns deures gramaticalment impecables i ortogràficament perfectes.
Un bon exemple del vertiginós progrés del software de traducció basat en IA és DeepL, desenvolupat en 2017 per una empresa de Colònia i utilitzat actualment per més d'un milió de persones cada dia per fer traduccions entre 28 idiomes.
Les seves traduccions automàtiques es basen en dades estadístiques que descriuen la probabilitat que unes certes paraules apareguin en determinats contextos, per a la qual cosa utilitza milers de milions de paràmetres.
L'empresa no escatima esforços per garantir l'alta qualitat de les traduccions que genera. Per exemple, el 2017 va dur a terme un estudi cec en el qual un grup de professionals de la traducció va valorar 100 frases traduïdes per DeepL i per tres programes de traducció de grans empreses tecnològiques de la competència. Els traductors van considerar que els textos generats per DeepL eren tres vegades millors que els del programa de traducció d'un conegut cercador, ja que els van trobar més naturals i idiomàtics.
Traducció de mostra realitzada pel traductor DeepL | © DeepL
UN SOFTWARE QUE ET FA ELS DEURES
A part de la traducció automàtica de textos, hi ha una altra àrea del processament del llenguatge natural que ha experimentat grans avenços tecnològics en els últims anys: la generació automàtica de textos. L'organització que més atenció ha captat últimament en aquest camp és OpenAI. Fundada a San Francisco el 2015, aquesta empresa es dedica, entre altres coses, a la recerca en intel·ligència artificial i a desenvolupar algorismes capaços de redactar i millorar textos.L'últim d'aquests algorismes, el denominat Generative Pretrained Transformer 3 (GPT-3), es va presentar per primera vegada el 2020 en forma de publicació científica. Actualment, el seu model lingüístic és el més gran de la seva categoria: ha estat entrenat amb 45 TB de dades i es fonamenta en una xarxa neuronal amb 175.000 milions de paràmetres. Aquest software es diferencia dels generadors de textos convencionals en dos aspectes: d'una banda, no utilitza blocs de text predefinits, i de l’altra, l'algorisme no està restringit a una àrea temàtica concreta, sinó que proporciona frases adequades pràcticament en qualsevol camp. Igual que la de DeepL, la xarxa neuronal de GPT-3 es basa en un model estadístic que descriu la probabilitat de paraules i frases en funció del context.
Si a GPT-3 se li dona una instrucció del tipus: "escriu una història sobre un nen anomenat Max que emprèn un viatge ple d'aventures pel món", l'algorisme GPT-3 compleix amb exactitud l'ordre rebuda i redacta una narració amb aquests paràmetres en qualsevol de les llengües disponibles. No obstant això, l'algorisme no té un coneixement propi del món, sinó que es limita a predir amb encert com podria ser la següent paraula o frase. Així és com els generadors de textos estan entrant cada vegada amb més força en l'ensenyament de llengües estrangeres, ja que per a un estudiant és òbviament molt més fàcil que un programa generi una redacció o un diàleg sobre un tema concret que no pas escriure'l per si mateix.
Exemple d'història creada per OpenAI GPT-3 Playground | © OpenAI
COM MÉS ÚTIL L'EINA, MÉS PROBABLE L’ABÚS
A més d'exemples com la redacció de textos per a les classes de llengües estrangeres, els generadors de text també poden utilitzar-se amb finalitats moralment qüestionables o finsi tot delictives. Així, resulta molt fàcil crear missatges de spam personalitzats i notícies falses. Tampoc és complicat falsificar articles acadèmics, la qual cosa pot potenciar la difusió de desinformació. Aquestes eines també s'usen amb bons resultats per redactar missatges de phishing i per perpetrar diferents tipus de frau en línia, com l’engany del sorteig o l'estafa romàntica.
Un altre dels perills dels programes de traducció i creació de textos basats en IA és que poden generar continguts problemàtics o llenguatge vulgar. Si les dades amb què s'entrena l'eina contenen llenguatge malsonant o estereotips racistes, sexistes o religiosos, sempre existeix el risc que aquests s'utilitzin o es reprodueixin en el text resultant.
Com més útil és l’eina, més possibilitats que abusin d’ella. Les usuàries i usuaris finals també han de tenir ben clar que són responsables de l'ús que fan d'aquesta mena de software i del que pot passar amb el resultat d'aquest ús.
ÚS ASSENYAT EN EL CONTEXT EDUCATIU
Com pot el professorat utilitzar aquestes eines de manera constructiva i alhora conscienciar a l'alumnat perquè en faci ús responsable? Una possibilitat seria treballar amb textos traduïts i generats per intel·ligència artificial per reforçar la consciència metalingüística de l'alumnat i mostrar-li les limitacions del software .En la traducció automàtica a partir de l'anglès o l'espanyol, per exemple, el software té problemes amb el gènere dels pronoms personals, tant presents com omesos, per la qual cosa sol produir errors. També li costa la traducció de metàfores i al·legories, és a dir, quan el text literal no té res a veure amb el sentit real de l'enunciat. A més, aquestes eines no acostumen a encertar amb el context, el tipus de destinatari i el registre lingüístic. Fer que els alumnes corregeixin les incoherències i errors semàntics, gramaticals i estilístics d'un text traduït automàticament pot ajudar-los a comprendre la dimensió metalingüística del text.
També als generadors automàtics de text se'ls pot treure profit en les classes de llengües estrangeres. Com no tenen un coneixement propi del món, sinó que es limiten a generar seqüències de paraules basant-se en dades estadístiques, els resultats no sempre són els esperats. Si bé a un generador de textos no li suposa cap problema escriure una història inventada amb un argument concret, la cosa se li complica prou quan ha de redactar textos acadèmics sobre temes especialitzats. D'altra banda, els problemes estilístics apuntats en el context de la traducció automàtica afecten en la mateixa mesura els generadors de textos. Per tant, es pot treballar amb textos generats amb IA a l'aula demanant a l'alumnat que els revisi amb diferents objectius: ja sigui per adaptar els textos a un registre o destinatari concrets o per complir determinats requisits de contingut en la redacció d'un text acadèmic.
Finalment, els generadors de text poden ajudar el professorat en la preparació de les classes. Per exemple, per introduir nou vocabulari. Així, se li pot donar a l'algorisme un tema determinat i indicar-li unes certes paraules que ha de contenir un text perquè el generi automàticament.
Exemple de text creat amb OpenAI GPT-3 Playground per introduir nou vocabulari © OpenAI
Un text de mostra creat pel GPT-3 Playground de OpenAI amb la finalitat d'introduir vocabulari. | © OpenAI
Així doncs, a part dels seus grans avantatges, les noves tecnologies també poden usar-se amb efectes enormement nocius, per la qual cosa seria interessant que l'alumnat desenvolupés estratègies a l'aula que permetin un ús responsable i constructiu del software basat en IA.
Bibliografia
Faes, Florian (2017): Why DeepL Got into Machine Translation and How It Plans to Make Money. Slator – Language Industry Intelligence. Recuperat el 5 de juliol de 2022 del lloc web: https://slator.com/deepl-got-machine-translation-plans-make-money/
Raveling, Jann (2022): Was ist ein neuronales Netz? Wirtschaftsförderung Bremen GmbH. Recuperat el 5 de juliol de 2022 del lloc web: https://www.wfb-bremen.de/de/page/stories/digitalisierung-industrie40/was-ist-ein-neuronales-netz.
Romero, Alberto (2021): Understanding GPT-3 in 5 Minutes. TowardsDataScience. Recuperat el 5 de juliol de 2022 del lloc web: https://towardsdatascience.com/understanding-gpt-3-in-5-minutes-7fe35c3a1e52.
Sciforce (2021): What is GPT-3, How Does It Work, and What Does It Actually Do? Medium. Recuperat el 5 de juliol de 2022 del lloc web: https://medium.com/sciforce/what-is-gpt-3-how-does-it-work-and-what-does-it-actually-do-9f721d69e5c1.
Smolentceva, Natalia (2018): DeepL: Cologne-based startup outperforms Google Translate. DeutscheWelle. Recuperat el 5 de juliol de 2022 del lloc web: https://www.dw.com/en/deepl-cologne-based-startup-outperforms-google-translate/a-46581948.