Inteligencia artificial en la enseñanza de lenguas extranjeras
El software basado en inteligencia artificial se abre camino en la enseñanza de lenguas extranjeras
La tecnología basada en la IA está en todas partes, y hoy en día cuesta imaginar la enseñanza de lenguas sin ella. Nos adentramos en el área del procesamiento del lenguaje natural y en los posibles usos (y abusos) de las herramientas de inteligencia artificial en el aula.
De Tobias Brockhorst
Hoy en día nos tropezamos cada dos por tres con tecnologías basadas en la inteligencia artificial (IA) en muchos ámbitos de nuestra vida: desde anuncios y resultados de búsqueda personalizados en Internet hasta el reconocimiento facial para desbloquear el móvil, pasando por los asistentes de voz y los dispositivos domésticos inteligentes. También en las clases de lenguas extranjeras vemos que estas herramientas son cada vez más populares. Aquí nos centraremos en dos áreas del procesamiento del lenguaje natural: la traducción automática y la generación automática de textos.
El procesamiento del lenguaje natural es una disciplina conjunta de la lingüística, la informática y la investigación en IA. Su objetivo es que los ordenadores "comprendan" el lenguaje hablado o escrito y así poder utilizarlos en tareas como el análisis y generación de textos, la traducción automática y el reconocimiento del habla. Para ello son indispensables unos algoritmos capaces de encontrar y reconocer patrones en una ingente cantidad de datos no estructurados: las llamadas redes neuronales.
Las traducciones humanas ya apenas se distinguen de las automáticas
El software de traducción automática se ha consolidado en la enseñanza de lenguas extranjeras. Cuando no entienden una palabra o una frase, los alumnos sacan intuitivamente el móvil para averiguar su significado. A diferencia de lo que ocurre con los pesados diccionarios convencionales, el móvil lo tenemos a mano en todo momento, y buscar información en él es mucho más rápido. También hay alumnos que utilizan los programas de traducción automática para traducir a otro idioma textos que han escrito en su lengua materna.Si hace unos años podíamos reconocer enseguida qué textos habían sido traducidos automáticamente, la investigación en el campo de la tecnología de la traducción ha avanzado tanto en la última década, que hoy en día es casi imposible saber si una traducción la ha hecho un humano o un ordenador. El profesorado es consciente de esta tendencia, sobre todo cuando un alumno o alumna produce textos mediocres en clase, pero trae de casa unos deberes gramaticalmente impecables y ortográficamente perfectos.
Un buen ejemplo del vertiginoso progreso del software de traducción basado en IA es DeepL, desarrollado en 2017 por una empresa de Colonia y utilizado por más de un millón de personas cada día para realizar traducciones entre 28 idiomas. Sus traducciones automáticas se basan en datos estadísticos que describen la probabilidad de que ciertas palabras aparezcan en determinados contextos, para lo cual maneja miles de millones de parámetros.
La empresa no escatima esfuerzos para garantizar la alta calidad de las traducciones que genera. Por ejemplo, en 2017 llevó a cabo un estudio ciego en el que un grupo de profesionales de la traducción valoró 100 frases traducidas por DeepL y por tres programas de traducción de grandes empresas tecnológicas de la competencia. Los traductores consideraron que los textos generados por DeepL eran tres veces mejores que los del programa de traducción de un conocido buscador, ya que los encontraron más naturales e idiomáticos.
Traducción de muestra preparada por el traductor de DeepL
| © DeepL
Un software que te hace los deberes
Aparte de la traducción automática de textos, hay otra área del procesamiento del lenguaje natural que ha experimentado grandes avances tecnológicos en los últimos años: la generación automática de textos. La organización que más titulares ha cosechado últimamente en este campo es OpenAI. Fundada en San Francisco en 2015, esta empresa se dedica, entre otras cosas, a la investigación en inteligencia artificial y a desarrollar algoritmos capaces de redactar y mejorar textos.El último de estos algoritmos, el denominado Generative Pretrained Transformer 3 (GPT-3), se presentó por primera vez en 2020 en forma de publicación científica. Actualmente, su modelo lingüístico es el mayor de su categoría: ha sido entrenado con 45 TB de datos y se fundamenta en una red neuronal con 175 000 millones de parámetros. Este software se diferencia de los generadores de textos convencionales en dos aspectos: por un lado, no utiliza bloques de texto predefinidos, y por otro, el algoritmo no está restringido a un área temática concreta, sino que proporciona frases adecuadas prácticamente en cualquier campo. Al igual que la de DeepL, la red neuronal de GPT-3 se basa en un modelo estadístico que describe la probabilidad de palabras y frases en función del contexto.
Si a GPT-3 le das una instrucción del tipo: "escribe una historia sobre un niño llamado Max que emprende un viaje lleno de aventuras por el mundo", el algoritmo GPT-3 cumple con exactitud la orden recibida y redacta una narración con esos parámetros, en cualquiera de las lenguas disponibles. No obstante, el algoritmo no tiene un conocimiento propio del mundo, sino que se limita a predecir con gran acierto cómo podría ser la siguiente palabra o frase. Y así es como los generadores de textos están entrando cada vez con más fuerza en la enseñanza de lenguas extranjeras, ya que para un estudiante es obviamente mucho más fácil que un programa genere una redacción o un diálogo sobre un tema concreto que escribirlo él mismo.
Ejemplo de historia creada por OpenAI GPT-3 Playground
| © OpenAI
Cuanto más útil la herramienta, más posibilidad de abusos
Además de ejemplos como la redacción de textos para las clases de lenguas extranjeras, los generadores de texto también pueden utilizarse con fines moralmente cuestionables o incluso delictivos. Así, resulta muy fácil crear mensajes de spam personalizados y noticias falsas. Tampoco resulta difícil falsificar artículos académicos, lo cual puede potenciar la difusión de desinformación. Estas herramientas también se usan con grandes resultados para redactar mensajes de phishing y perpetrar distintos tipos de fraude online, como el timo del sorteo o la estafa romántica.Otro de los peligros de los programas de traducción y creación de textos basados en IA es que pueden generar contenidos problemáticos o lenguaje vulgar. Si los datos con que se entrena la herramienta contienen lenguaje malsonante o estereotipos racistas, sexistas o religiosos, siempre existe el riesgo de que estos se utilicen o reproduzcan en el texto resultante.
Cuanto más útil es la herramienta, mayores las posibilidades de que abusen de ella. Las usuarias y usuarios finales también deben tener bien claro que son responsables del uso que hacen de este tipo de software y de lo que ocurre con el producto de dicho uso.
USO SENSATO EN EL CONTEXTO EDUCATIVO
¿Cómo puede el profesorado utilizar estas herramientas de manera constructiva y al mismo tiempo concienciar al alumnado para que haga uso responsable? Una posibilidad sería trabajar con textos traducidos y generados por inteligencia artificial para reforzar la conciencia metalingüística del alumnado y mostrarle las limitaciones del software.En la traducción automática a partir del inglés o el español, por ejemplo, el software tiene problemas con el género de los pronombres personales, tanto presentes como omitidos, por lo que suele producir errores. También le cuesta la traducción de metáforas y alegorías en las que el texto literal no tiene nada que ver con el sentido real del enunciado. Además, estas herramientas no suelen acertar con el contexto, el tipo de destinatario y el registro lingüístico. Hacer que los alumnos corrijan las incoherencias y errores semánticos, gramaticales y estilísticos de un texto traducido automáticamente puede ayudarles a comprender la dimensión metalingüística del texto.
También a los generadores automáticos de texto se les puede sacar provecho en las clases de lenguas extranjeras. Como no tienen un conocimiento propio del mundo, sino que se limitan a generar secuencias de palabras basándose en datos estadísticos, los resultados no siempre son los esperados. Si bien para un generador de textos no supone ningún problema escribir una historia inventada con un argumento concreto, la cosa se le complica bastante cuando tiene que redactar textos académicos sobre temas especializados. Por otro lado, los problemas estilísticos apuntados en el contexto de la traducción automática afectan en la misma medida a los generadores de textos. Por lo tanto, se puede trabajar con textos generados con IA en el aula pidiendo al alumnado que los revise con distintos objetivos: ya sea para adaptar los textos a un registro o destinatario concretos o para cumplir determinados requisitos de contenido en la redacción de un texto académico.
Por último, los generadores de texto pueden ayudar al profesorado en la preparación de las clases. Por ejemplo, para introducir nuevo vocabulario. Así, se le puede dar al algoritmo un tema determinado e indicarle ciertas palabras que debe contener un texto para que lo genere automáticamente.
Un texto de ejemplo creado por el GPT-3 Playground de OpenAI con el fin de introducir vocabulario
| © OpenAI
Así pues, aparte de sus grandes ventajas, las nuevas tecnologías también pueden usarse con efectos enormemente dañinos, por lo que resultaría interesante que el alumnado desarrollara estrategias en el aula que permitan un uso responsable y constructivo del software basado en IA.Faes, Florian (2017): Why DeepL Got into Machine Translation and How It Plans to Make Money. Slator – Language Industry Intelligence. Recuperado el 5. de julio de 2022, del sitio web: https://slator.com/deepl-got-machine-translation-plans-make-money/.
Raveling, Jann (2022): Was ist ein neuronales Netz?. Wirtschaftsförderung Bremen GmbH. Recuperado el 5 de julio de 2022, del sitio web: https://www.wfb-bremen.de/de/page/stories
/digitalisierung-industrie40/was-ist-ein-neuronales-netz.
Romero, Alberto (2021): Understanding GPT-3 in 5 Minutes. TowardsDataScience. Recuperado el 5 de julio de 2022, del sitio web: https://towardsdatascience.com/understanding-gpt-3-in-5-minutes-7fe35c3a1e52.
Sciforce (2021): What is GPT-3, How Does It Work, and What Does It Actually Do?. Medium. Recuperado el 5 de julio de 2022, del sitio web: https://medium.com/sciforce/what-is-gpt-3-how-does-it-work-and-what-does-it-actually-do-9f721d69e5c1.
Smolentceva, Natalia (2018): DeepL: Cologne-based startup outperforms Google Translate. DeutscheWelle. Recuperado el 5 de julio de 2022, del sitio web: https://www.dw.com/en/deepl-cologne-based-startup-outperforms-google-translate/a-46581948.