Compreender a tradução automática neuronal
Como “trabalha” a inteligência artificial na tradução literária

Como “trabalha” a inteligência artificial na tradução literária
Como “trabalha” a inteligência artificial na tradução literária | Philippos Vassiliades | CC-BY-SA

Quando o Google Translate foi introduzido, em 2006, conseguia traduzir apenas duas línguas. Em 2016, já traduzia mais de 103 línguas e 100 mil milhões de palavras por dia. O sistema não traduz apenas, mas também transcreve em tempo real oito das línguas mais difundidas. As máquinas conseguem aprender e fazem-no rapidamente.

De Alana Cullen

No entanto, existem códigos linguísticos que as máquinas ainda terão de decifrar. A inteligência artificial continua a lutar contra a enorme complexidade da língua humana, sendo que a língua não tem lugar mais complexo e cheio de significado do que na literatura. Frequentemente a beleza dos romances, poemas e peças de teatro reside nos matizes e na subtileza. As máquinas traduzem palavra por palavra, seguindo as regras formuladas pela linguística, sendo essa a razão para os sistemas tradicionais de tradução não entenderem sempre o significado dos textos literários. Estes sistemas não compreendem a palavra a ser traduzida dentro de um contexto de frase, de parágrafo ou de página.

Existe agora uma nova tecnologia que se debruça sobre este caos contextual – a Neural Machine Translation (tradução automática neuronal), ou abreviada NMT. Apesar de estar a dar os primeiros passos, a NMT já provou que os seus sistemas vão aprender com o tempo a ultrapassar a complexidade de traduções literárias. A NMT marca o início de uma nova era da inteligência artificial. Já não trabalha com as regras compostas pelos linguistas, mas cria novas regras ou mesmo uma linguagem própria.

Tradução Automática Neuronal (NMT)

A NMT foi introduzida em 2016. Até hoje é o software de tradução com mais sucesso. Não se pode apenas gabar de ter reduzido a taxa de erro em 60%, comparando com a sua antecessora Statistical Machine Translation (SMT), mas também de ser consideravelmente mais rápida.

Estas melhorias têm como base a rede neuronal artificial do sistema. Diz-se que é baseada no modelo dos neurónios do cérebro humano. Esta rede possibilita ao software a criação de ligações contextuais entre palavras e frases e pode fazê-lo aprendendo as regras da língua. A rede digitaliza milhões de frases no seu banco de dados e identifica as similaridades. A máquina utiliza posteriormente as regras que aprendeu para criar modelos estatísticos que a ajudam a compreender a construção de uma frase.

A rede artificial neuronal. Um texto é introduzido na rede, depois enviado para vários “níveis” escondidos da rede, surgindo finalmente na língua de destino
A rede artificial neuronal. Um texto é introduzido na rede, depois enviado para vários “níveis” escondidos da rede, surgindo finalmente na língua de destino | Alana Cullen | CC-BY-SA

Uma língua artificial

A caraterística pioneira da NMT é a criação de uma nova linguagem de números, que lhe dá apoio na tradução.

Olhando por exemplo para a a frase do Hamlet de Shakespeare "To thine own self be true". A máquina codifica cada palavra em número, ou em denominados vetores: 1,2,3,4,5,6. Esta sequência de números é introduzida na rede neuronal, como se pode ver aqui à esquerda. É nestes níveis escondidos onde se dá a "magia". Com base nas regras aprendidas, o sistema encontra as palavras correspondentes na língua de destino. São produzidos posteriormente os números 7,8,9,10,11, correspondendo às palavras da frase de destino. Estes números são decifrados para a língua correspondente e o resultado é a frase "Ser fiel a ti mesmo"

Em princípio, o sistema traduz as palavras para uma linguagem própria e "pensa" depois numa maneira de transpor as palavras para uma frase compreensível, com base em conhecimentos prévios, tal como o cérebro humano o faria.

entender o contexto

John R. Firth, 1957, fundador da linguística contextual

John R. Firth, 1957, John R. Firth, 1957, fundador da linguística contextual

A NMT consegue traduzir literatura com sucesso, porque entende o contexto de maneira lenta, mas segura. Este sistema não se concentra apenas na palavra a traduzir, mas também naquelas que surgem antes e depois.

Comparável a um cérebro que decifra as mais diversas informações, esta rede neuronal artificial também olha para a informação recebida e cria a próxima palavra com base na palavra seguinte. Depois de algum tempo, esta rede aprende a escolher as palavras em que se deve concentrar e, com base nos exemplos existentes, o contexto decisivo. Este processo é uma espécie de aprendizagem com vários níveis, o que leva a que o sistema aprenda e melhore cada vez mais. Na NMT, a decifração do contexto é denominada “orientação” e acontece no mecanismo attention, que se encontra no sistema entre a codificação e a descodificação.
Processo de adaptação. A adaptação é processada através dos mecanismos de atenção da rede neuronal artificial e tira conclusões sobre o contexto da palavra
Processo de adaptação. A adaptação é processada através dos mecanismos de atenção da rede neuronal artificial e tira conclusões sobre o contexto da palavra | Alana Cullen | CC-BY-SA
Mas as máquinas também não são perfeitas. Se a frase de Shakespeare for novamente traduzida novamente para inglês, será "be true to yourself", o que não corresponde ao caráter da língua dos Tudor na época de Shakespeare. A tradução literária de palavra-por-palavra é "sê fiel ao teu próprio ser", mas os tradutores humanos têm mais a tendência de traduzir "sê fiel a ti próprio".
Tradução feita por pessoas. Se as frases foram traduzidas por humanos, as interligações são muito mais complexas do que nas traduções de inteligência artificial. A razão para isso é que as pessoas dispõem de uma maior compreensão contextual
Tradução feita por pessoas. Se as frases foram traduzidas por humanos, as interligações são muito mais complexas do que nas traduções de inteligência artificial. A razão para isso é que as pessoas dispõem de uma maior compreensão contextual | Alana Cullen | CC-BY-SA
Mesmo assim, é interessante notar como o Google Translate reconheceu a importância da palavra "fiel" no contexto. O facto de ter usado esta palavra prova que o Google Translate conseguiu distinguir entre fiel e verdadeiro. A aprendizagem em vários níveis significa que uma frase mal traduzida pode voltar a ser traduzida corretamente umas semanas mais tarde, pelo menos parcialmente. (quando este artigo for publicado, é possível que o Google Translate já tenha corrigido os seus erros.)

O constante aperfeiçoamento da língua que lhe é mais familiar significa que se pode pedir à NMT para fazer traduções Zero-Shot. Aqui a NMT traduz uma língua para várias outras línguas sem utilizar o inglês como passo intermédio.

Lost in Translation

Apesar da tradução automática ter dado grandes passos nos últimos anos, ainda não atingiu o nível literário. Henry James acentuava a importância de entender o texto na língua original, quando observou que o tradutor literário ideal deveria ser uma pessoa "a quem nada escapa". Pelo menos no que diz respeito à literatura, as máquinas ainda têm um grande caminho à sua frente até esse ideal ser atingido.

Em traduções literárias, a NMT tem problemas com palavras raras, nomes próprios e linguagem técnica complicada. Apenas 25 a 30% das traduções atingem a qualidade literária. Um estudo que se debruçou sobre a tradução de alemão para inglês descobriu que o sistema fazia poucos erros de sintaxe, mas que não conseguia encontrar uma tradução adequada para palavras com sentidos múltiplos. Apesar destas falhas, a qualidade da tradução era suficiente para se entender a história e ter prazer na leitura. Um outro estudo, que se ocupou das traduções de inglês para a língua catalã, chegou a um resultado igualmente positivo. 25% das pessoas de língua materna pensa que a qualidade da tradução automática é comparável à tradução humana.

Apesar disso, o sistema de tradução não atinge sempre resultados satisfatórios. Em algumas combinações de línguas, o sistema tem dificuldades com línguas morfologicamente ricas, nas quais a inflexão e acentuação são de grande importância. Este exemplo diz especialmente respeito a algumas línguas eslavas. De destacar são os casos de tradução de uma língua menos complexa para uma mais complexa. Por isso, o NMT não pode ainda ser utilizado como instrumento global de tradução.

Como encontrar o tom adequado?

O maior desafio continua a ser o de encontrar o tom correto e o registo adequado para o texto a traduzir. Peter Constantine, diretor do Programa de Tradução da Universidade de Connecticut, explica que as máquinas têm de encontrar o tom adequado para conseguirem traduzir literatura com sucesso.

O que é que a máquina vai imitar? Irá criar brilhantes e bonitas foreignisations (estrangeirismos) ou uma óptima domestication (domesticação)? Ou vai fazer com que a língua de Tchekhov se pareça com um texto escrito por ele em dez minutos no metro de Londres.

Peter Constantine (2019)

Qual o tom irá a máquina eleger? Como exemplo, vejamos a obra do Prémio Nobel Thomas Mann. Ao longo dos anos, o seu estilo de escrita modificou-se. De início, as suas histórias eram ainda mais jocosas do que os seus pesados romances tardios. Se as traduções devem demonstrar o sentido pretendido, as máquinas terão de reconhecer essas variações.

Importante colaboração

Torna-se claro que, apesar de todos os esforços, a máquina ainda necessita de uma organização humana para resolver os significados múltiplos das palavras e a flexibilidade da linguagem literária. A NMT não consegue substituir os tradutores humanos, mas pode servir de instrumento útil na tradução de literatura.

A colaboração entre tradução humana e automática é de grande importância. Uma solução para o problema seria a adoção de uma revisão humana da tradução automática. Neste caso, os tradutores profissionais que estão familiarizados com os problemas da tradução automática poderiam redigir uma primeira versão da tradução automática, conseguindo assim que colegas de tradução com mais experiência possam ajudar os outros com menos. Uma revisão simples poderia corrigir pequenos erros de ortografia e gramática e um trabalho posterior mais profundo dedicar-se-ia a problemas mais amplos como a estrutura das frases e o estilo de escrita. No caso de traduções literárias a revisão é obrigatória, para que o tom certo da tradução seja encontrado. Um estudo concluiu que este método, no caso da tradução de um livro de ficção científica galês para a língua irlandesa, foi 31% mais rápido do que uma tradução sem a ajuda do software. Para além disso, a produtividade dos tradutores aumentou em 36%, quando utilizam a tradução automática como ponto de partida. Com este método, geravam um acréscimo de 182 palavras por hora

A inteligência artificial ocupa um papel cada vez maior na nossa vida. Devemos aproveitar este instrumento de tradução a nosso favor para dar alento ao setor da tradução. A tradução automática percorreu um grande caminho, desde o início até a este instrumento atual. O software faz o trabalho miúdo e maçador, enquanto os tradutores se dedicam ao trabalho mais pormenorizado, o que pode aliviar o trabalho das tradutoras e dos tradutores. A NMT pode ainda traduzir para línguas que nunca tenham sido traduzidas. No mais, a NMT pode também ajudar à aprendizagem de uma língua nova. Quando trabalhamos com a NMT, podemos usá-la como instrumento de aprendizagem que possibilite a todos um melhor acesso à literatura e à língua.


Fontes:

Brownlee, J. 2017. A Gentle Introduction to Neural Machine Translation. [Accessed 9th July 2020].

Constantine, P. 2019. Google Translate Gets Voltaire: Literary Translation and the Age of Artificial Intelligence. Contemporary French and Francophone Studies. 23(4), pp. 471- 479.

Goldhammer, A. 2016. The Perils of Machine Translation. The Wire. [Accessed 14th July 2020].

Google Brain Team. 2016. A Neural Network for Machine Translation, at Production Scale. [Accessed 9th July 2020].

Gu, J., Wang, Y., Chu, K., Li. V. O. K. 2019. Improved Zero-shot Neural Machine Translation via Ignoring Spurious Correlations.arXiv. [Accessed 10th July 2020].

Iqram, S. 2020. Now you can transcribe speech with Google Translate. [Accessed 9th July 2020].

Jones, B., Andreas, J., Bauer, D., Hermann, K. M., and Knight, K. 2012. Semantics- Based Machine Translation with Hyperedge Replacement Grammars. Anthology. 12(1083), pp. 1359- 1376.

Kravariti, A. 2018. Machine Translation: NMT translates literature with 25% flawless rate. Translate Plus. [Accessed 14th July 2020].

Matusov, E. 2019. The Challenges of Using Neural Machine Translation for Literature. European Association for Machine Translation: Dublin, Ireland.

Maučec, M. S., and Donaj, G. 2019. Machine Translation and the Evaluation of Its Quality Recent Trends in Computational Intelligence. Intech Open.

Shofner, K. 2017. Statistical vs. Neural Machine Translation. ULG’s Language Solutions Blog. [Accessed 10th July 2020].

Systran. 2020. What is Machine Translation? Rule Based Translation vs. Statistical Machine Translation. [Accessed 9th July 202].

Toral, A., Wieling, M., and Way, A. 2018. Post-editing Effort of a Novel with Statistical and Neural Machine Translation. Frontiers in Digital Humanities. 5(9).

Turovsky, B. 2016. Ten years of Google Translate. [Accessed 9th July 2020].

Wong, S. 2016. Google Translate AI invents its own language to translate with. New Scientist. [Accessed 11th July].

Yamada, M. 2019. The impact of Google Neural Machine Translation on Post-editing by student translators. The Journal of Specialised Translation. 31, pp. 87- 95.

Zameo, S. 2019. Neural Machine Translation: tips and advantages for your digital translations. Text Master Go Global. [Accessed 14th July 2020].