Inteligência artificial no ensino de línguas estrangeiras
A correção de textos na aprendizagem de línguas estrangeiras ainda é trabalho manual

Mão com uma caneta vermelho que corrige um texto
Correção pertinente requer competência técnica e sensibilidade | © Getty Images | © Getty Images

“Textos de alta qualidade com um clic” é a promessa de muitos fornecedores de assistentes digitais de redação.  Sistemas mecânicos já conseguem gerar instantaneamente uma ampla gama de correções de texto e sugestões de ajuste. Mas qual é a real qualidade dessas correções e será que de fato ajudam quem está aprendendo uma língua estrangeira a redigir um bom texto?
 

Considerando a vasta gama de novas tecnologias de idiomas e de ferramentas digitais de suporte na Internet, surge a pergunta para que ainda aprender uma língua estrangeira? Aplicativos inteligentes traduzem os nossos textos em milissegundos (DeepL, Google Translate) ou nos ajudam a elaborar um texto próprio sem erros e com estilo requintado: seja através da função de autocorreção nos aplicativos do Office e do browser de nossa escolha ou por meio de assistentes mais abrangentes como o Duden-MentorGrammarly ou o LanguageTool.

Muitos fornecedores de assistentes de redação prometem em sua propaganda facilitar a nossa vida, em qualquer situação, com textos melhores e, assim, nos proporcionar mais sucesso. O repertório dos aplicativos abrange tanto a verificação ortográfica, gramatical e de pontuação, como também a otimização estilística dos textos ou a reformulação de frases inteiras.

Não seria óbvio então usar esses aplicativos também para a aprendizagem de línguas estrangeiras? E será que ainda precisamos de docentes formadas/os, se as correções e sugestões de otimização de aplicativos mecânicos são muito mais rápidas, precisas e objetivas, como é propagado por alguns?

A Languagetool colocada à prova

Um estudo feito no Goethe-Institut em cooperação com cientistas da Humboldt-Universität zu Berlin mostrou que não é tão simples assim: ferramentas atuais de autocorreção até podem ajudar falantes de língua materna ou com conhecimentos avançados no idioma a elaborar textos melhores. Mas principalmente para alunas/os iniciantes de um idioma, que querem aprender a redigir textos bons, essas ferramentas não são úteis. Do ponto de vista didático e de qualidade, ferramentas de autocorreção só são recomendadas nesses casos, se passarem por consideráveis adaptações.
 
Das LanguageTool
Objeto do estudo foi o LanguageTool: uma aplicação open-source para a verificação de gramática, estilo e ortografia para diversos idiomas que, devido ao seu código de origem aberto, são a base de muitos aplicativos de correção disponíveis na Internet. Ao longo do tempo, o LanguageTool amadureceu e é hoje um assistente de redação desenvolvido, mas que só disponibiliza todos os seus potenciais na versão paga e, segundo afirmações próprias, é usado por milhões de pessoas no mundo inteiro. Em torno do LanguageTool existe toda uma comunidade ativa que está continuamente aperfeiçoando a ferramenta. A versão atual para a língua alemã engloba 4500 regras nas categorias gramática, pontuação, ortografia, tipografia, expressões idiomáticas, linguagem inclusiva entre outros.
 

A experiência

Na comparação direta com as/os professoras/es do Goethe-Institut o LanguageTool chamou a atenção por sua imprecisão. Nos textos de alunas/os de cursos on-line do Goethe-Institut do nível A2 ele marcava bem mais erros do que as/os tutoras/es que participaram do estudo. Em muitos casos, os erros assinalados nem eram erros, ou eram irrelevantes, por exemplo, nomes próprios ou outros fragmentos de orações considerados erroneamente como incorretos e elementos que ainda nem faziam parte do nível de conhecimento das/dos alunas/os.  Por outro lado, em casos de erros gramaticais mais complexos, o contrário podia ser observado. Especialmente erros de construção de frases não eram identificados, o que, visto no todo, resultou em uma taxa de acerto muito ruim.

Os fatores responsáveis pela imprecisão e a baixa taxa de acerto do LanguageTool se deve a abordagens tecnológicas quando se trata da identificação de erros gramaticais, bem como à falta de um nível semântico no caso de correções baseadas em regras. Portanto, um aplicativo de correção útil também deveria identificar informações semânticas ou relativas ao contexto para poder reconhecer nomes próprios como tais e não corrigi-los.

Exemplo de um texto de uma aluna corrigido pelo LanguageTool. | © Goethe-Institut Exemplo de um texto de uma aluna corrigido pelo LanguageTool. | © Goethe-Institut | © Goethe-Institut

FEEDBACK DE CORREÇÃO NA APRENDIZAGEM DE UMA LÍNGUA ESTANGEIRA

Na realidade, a situação é ainda mais complexa. Por natureza, aprender uma língua estrangeira é aprender uma língua nova. Corrigir um texto engloba, portanto, também um componente didático. O feedback de correção ideal depende da situação específica de quem aprende e do seu padrão de aprendizagem. Pode-se fazer uma correção focada e implícita, mas também abrangente e explícita. Quando a/o docente se concentra na correção de certos tipos de erros, tem a possibilidade de chamar a atenção de quem aprende para um problema específico. Correções implícitas podem ter como efeito a motivação das/dos alunas/os a procurar por iniciativa própria as regras que regem a formulação correta. As/Os professoras/es consultadas/os reclamaram principalmente dessas deficiências didáticas do LanguageTool nas suas correções e sugestões de otimização. Além disso, foi enfatizado repetidamente que a falsa identificação de erros e as sugestões erradas de correção são especialmente problemáticas para quem aprende uma língua, pois ainda não tem condições de identificar a correção errada. Também não se deve ignorar fatores psicológico-motivacionais. Correções em demasia e, principalmente, erradas podem ter um efeito desmotivador sobre o comportamento de aprendizagem.  

CONCLUSÃO & PERSPECTIVAS

Sem adequações abrangentes e específicas para a área da aprendizagem de alemão como língua estrangeira, a tecnologia em que se baseia o LanguageTool praticamente não pode ser usada para a correção apropriada de textos livres de aprendizes de alemão.

Além das abordagens baseadas em regras, há alguns anos, também existe a possibilidade de corrigir textos e propor melhorias através de modelos linguísticos. Denominamos, aqui, de modelos linguísticos arquiteturas de rede neurais complexas, pré-treinadas, capazes de modelar uma língua no seu todo. O aspecto especial nisso é: modelos linguísticos são atentos, dispõe de um certo grau de compreensão, conferindo sentido e contexto às palavras e aos fragmentos de palavras.

No desenvolvimento de modelos linguísticos, ultimamente, foi quebrado um recorde após outro. Essas arquiteturas de rede de fato são muito boas em “entender”, manipular e imitar a linguagem natural. Um dos modelos linguísticos mais famosos é o Generative Pretrained Transformer 3 (GPT-3), da organização americana OpenAI.

Mas para usá-los na correção e revisão de textos de aprendizes de uma língua, também essas precisam passar por ajustes consideráveis. Modelos linguísticos abrangentes e prontos para uso existem, hoje, primordialmente para a língua inglesa. Uma prática comum para corrigir textos em alemão é vertê-los, primeiro, para o inglês, fazer ajustes nesses textos e, depois, traduzi-los novamente para o alemão. Ao longo das diversas etapas desse processo, porém, os textos sofrem um perceptível estranhamento, contendo vocábulos, expressões e estruturas gramaticais que aprendizes da língua ainda nem conhecem.

Soma-se a isso o fato de que os modelos linguísticos foram treinados para o uso idealizado, ou seja, normal da língua e, por isso, não conseguem corrigir de modo didaticamente diferenciado. Para quem aprende uma língua em nível básico, portanto, as sugestões de correção e melhorias frequentemente não fazem sentido, uma vez que, como já mencionado acima, o que importa não é só o uso ideal da língua, mas há outros fatores relevantes.

Exemplo da otimização de texto de uma aluna de língua feita por um modelo linguístico (GPT-NeoX 20B via https://nlpcloud.com) | © Goethe-Institut Exemplo da otimização de texto de uma aluna de língua feita por um modelo linguístico (GPT-NeoX 20B via https://nlpcloud.com) | © Goethe-Institut | © Goethe-Institut No caso dos modelos linguísticos também há o risco de não ser mais possível rastrear por que é feita certa correção ou melhoria. Ao contrário das abordagens baseadas em regras, não há regras definíveis que permitam tirar conclusões sobre os motivos das alterações. As correções baseiam - colocando em termos simples - naquilo que visto de modo geral é estatisticamente o mais provável no respectivo contexto. Uma pontuação ou uma palavra considerada errada é substituída pela pontuação ou palavra que, no contexto específico da sentença e do texto, ocorre com maior frequência.

Em termos de sustentabilidade, resta dizer que o uso de modelos linguísticos é uma opção que demanda muitos recursos. O desenvolvimento, treinamento e a operação de modelos linguísticos grandes pré-treinados, como o famoso GPT-3, consome em torno de mil megawatt de energia, custa milhões e demanda bilhões de pontos de dados.

Portanto, a correção apropriada e didaticamente adequada de textos de alunas e alunos de um idioma, por ora, vai continuar sendo tarefa de docentes qualificados.

DÚVIDAS?

Então experimente por conta própria. A seguir apresentamos dois textos de aprendizes de idioma que você poderá submeter a um assistente linguístico da sua escolha.
 

Hallo Kadira. Mein Traum haus hat eine großküche, ein groß und hell bad mit ein groß Spiegel. Mein Slafszimmer hat einen groß bett, viel Schranks, Meinen Arbeitzimmer hat einen Bibliothek, einen Tisch für den Computer un ein bequemer Stuhl. Sie hat auch ein großer und farbenfroher Garten. Mit Freundlichen Grüßen, Tho

 

Liebe Taisha. Das ist meine Tag. Jeden Morgen ich aufstehe um 5:30 Uhr und ich zaubere den Frühstück für mich und meine Tochter Khaleesi. Dann ich arbeite bis 16 Uhr. ; Von 16:15 bis 18:45 spiele ich mit Khaleesi, um 19 Uhr haben wir das Abendessen und ich vorbereite Khaleesi für das Bett um 8 Uhr. Sie habe ein Bad und sie schlaft von 21 Uhr. Dann ich arbeite, zaubere die Essen für den Morgen oder ich lerne Deutsch. Es kann helfen um eine Kultur besser zu verstanden, und auch um mehrere Leute zu können lernen. Viele Grüße, Sichin

 
Fontes

Sylvio Rüdian, Moritz Dittmeyer, und Niels Pinkwart (2022): Challenges of using auto-correction tools for language learning. In LAK22: 12th International Learning Analytics and Knowledge Conference (LAK22). Association for Computing Machinery, New York, NY, USA, 426–431. https://doi.org/10.1145/3506860.3506867

Nassaji, H., & Kartchava, E. (Herausgeber) (2021): The Cambridge Handbook of Corrective Feedback in Second Language Learning and Teaching (Cambridge Handbooks in Language and Linguistics). Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108589789