Ferramentas digitais de tradução
Poderá a inteligência artificial ser um apoio à tradução?

IA a apoiar os tradutores literários
IA a apoiar os tradutores literários | Philippos Vassiliades | CC-BY-SA

Em que medida é que as traduções literárias se distinguem das outras formas de tradução? Dito de uma forma simplista, em traduções especializadas, como as dos ramos comercial, jurídico ou médico, a atenção recai sobre o significado do texto; já nas traduções literárias recai com igual importância sobre o estilo do mesmo.

De Roy Youdale

No estilo literário, não importa apenas o que é dito, mas também como é dito. Segundo o crítico literário Terry Eagleton, a escrita literária é “o tipo de escrita cujo conteúdo não se deixa separar da língua em que é apresentado”. Neste sentido, as duas frases abaixo formuladas refletem à partida o mesmo significado, porém o modo como o mesmo é expressado e, consequentemente, o que espoleta nos/as leitores/as é muito distinto.

  1. "Ela colheu uma campaínha violeta do chão." (Original: „Sie pflückte eine violette Glockenblume aus der Erde.“)
  2. "Violeta era a cor daquele sinal primaveril colhido por ela do solo, a campaínha." (Original: „Violett war die Farbe dieses von ihr aus der Erde gepflückten Frühlingsboten, der Glockenblume.“)
Traduzir a frase 1 tal como a frase 2 iria distorcer completamente o texto original.

Neste sentido, um/a tradutor/a literário/a tem de ter em consideração tanto o estilo como o conteúdo e, desta forma, tomar decisões linguísticas, sendo que se ouve frequentemente dizer que dois/duas tradutores/as nunca traduziriam o mesmo texto da mesma maneira. Como procedem então os/as tradutores/as literários/as para reconstruírem o significado de um texto assim como a apreensão do mesmo junto dos/das leitores/as (o modo como estes/as o percecionam)? Basicamente, buscando padrões linguísticos no original e procurando reproduzi-lo numa outra língua – um processo a que chamo creative reverse engineering (engenharia criativa invertida)..

Inteligência artificial e o reconhecimento de modelos linguísticos

Os seres humanos tanto são animais de hábitos como indivíduos. Do mesmo modo que nos deslocamos sempre de determinada maneira e distintamente de todos os outros e que temos impressões digitais únicas, também ao escrever utilizamos padrões de expressão de forma consciente e inconsciente. Estes tornam-nos identificáveis enquanto autores/as, tendo um papel determinante na tradução dos nossos textos para outra língua. Alguns desses padrões linguísticos são fáceis de detetar. Se, a título de exemplo, um/a autor/a recorrer bastante a linguagem informal, ou antes a palavras pomposas como discombobulated, tal é facilmente reconhecível. Mas existem outros aspetos no estilo literário que não são tão facilmente identificáveis e que, contudo, influenciam a leitura. Entre eles encontram-se, por exemplo, o comprimento das frases e o recurso à pontuação e às repetições. Se não estivermos sensibilizados para a presença e a importância destes padrões linguísticos, também não conseguimos reproduzi-los numa tradução literária.

Como seria se a inteligência artificial (IA) conseguisse ajudar os/as tradutores/as a identificar os padrões linguísticos dos/as autores/as? A boa notícia é que consegue efetivamente e de forma cada vez mais diferenciada. Um software como o Sketch Engine consegue, com uns meros cliques de rato, fazer listagens de todas as palavras de um texto de acordo com a sua frequência; consegue analisar o comprimento das frases (tanto no que respeita à média como à categorização por frequência de frases compostas por duas, três, quatro ou mais palavras); consegue listar n-gramas (sequências de duas, três, quatro ou mais palavras repetidas) de acordo com o seu comprimento e frequência; e consegue analisar a extensão do vocabulário (o número de diversos tipos de palavras em comparação com todas as palavras utilizadas), entre muitas outras funcionalidades. O programa de visualização de texto Voyant Tools consegue apresentar visualmente diversas marcas linguísticas de um texto, mostra a frequência das palavras enquanto nuvens de palavras e a frequência de cada palavra e frase ao longo de um texto em gráficos. Ao programa de análise de texto Coh-Metrix basta um clique para apresentar mais de 200 categorias estatísticas referentes ao recurso linguístico e legibilidade.

Encontrar uma variedade de padrões linguísticos num texto a traduzir é uma coisa, mas como consegue o/a tradutor/a reproduzir isso numa outra língua? E se a IA conseguisse fazer mais do que apenas analisar os padrões linguísticos no seguimento de um comando do/a tradutor/a e conseguisse, ela mesma, traduzir? Tal como qualquer utilizador do Google Translate sabe, a resposta a  esta pergunta é que a IA o consegue fazer e, na verdade, de várias maneiras. Um outro artigo sobre este tema reflete sobre como a tradução automática neuronal (NMT, neural machine translation) tem sido utilizada em traduções literárias nos últimos anos. O artigo e os estudos citados no mesmo sugerem que, apesar da tradução literária totalmente automática ainda ter um longo caminho a percorrer até conseguir atingir a qualidade de uma tradução humana, a sua utilização na elaboração de uma espécie de primeiro esboço a trabalhar posteriormente por um/a tradutor/a (em jargão, pós-editado) é atualmente uma realidade. E há ainda uma outra função em que a IA é um recurso para as traduções literárias: sugerindo hipóteses de tradução em tempo real enquanto se datilografa.

Inteligência artificial e o convívio com diversas técnicas de tradução

Por forma a entender-se o conceito, é preciso explicar primeiro como funciona o software de tradução assistida por computador (computer-aided translation, CAT). Praticamente todos/as os/as tradutores/as de textos técnicos e alguns tradutores/as literários os utilizam. As ferramentas CAT (CAT tools), como são denominados estes programas de software, foram desenvolvidos nos anos 60 e 70 do século XX e são comercializados desde os anos 80. A tecnologia por detrás dos mesmos chama-se memória de tradução (MT), que defende a ideia de que o/a tradutor/a nunca precisará de traduzir a mesma frase duas vezes caso a mesma se repita no texto. Enquanto o/a tradutor/a trabalha o documento, o programa grava automaticamente tudo o que já foi traduzido. Caso surja uma frase já traduzida, o programa deteta-a, sugerindo ao/à tradutor/a a solução já adotada, poupando-lhe tempo e trabalho e permitindo, simultaneamente, manter a coerência do texto, o que também é frequentemente muito importante. É um facto, porém, que as ferramentas CAT se adequam preferencialmente a textos construídos com muitas repetições, linguisticamente uniformes e com frases relativamente curtas.

Normalmente, o interface das ferramentas CAT mostra o texto a traduzir na forma de uma tabela, onde o mesmo se encontra dividido em frases (ou segmentos), ocupando cada uma destas uma célula nessa mesma tabela. O texto de partida surge do lado esquerdo, ao passo que o lado direito apresenta células vazias, nas quais é inserida a tradução, tal como se pode ver aqui:
Interface de tradução do software Smartcat
Interface de tradução do software Smartcat | Roy Youdale | Smartcat | CC-BY-SA
No Smartcat, uma ferramenta CAT online gratuita, surge do lado direito, além das colunas visíveis na captura de ecrã, um espaço no qual aparecem as sugestões da MT e que o/a tradutor/a pode aceitar ou recusar. Nas ferramentas CAT iniciais, todas as sugestões provinham exclusivamente da base de dados dos segmentos já produzidos no texto em questão. Desde então, o espectro das fontes das sugestões de tradução das ferramentas CAT expandiu-se substancialmente. Atualmente é possível importar para uma ferramenta CAT uma MT de uma ou várias traduções semelhantes, aceder ou criar glossários especializados (ou bases terminológicas) e pesquisar MT para verificar como palavras e frases isoladas, ou frases completas, já foram traduzidas. Para tal foi determinante a inclusão da tradução automática (TA) nas ferramentas CAT..

A TA requer um computador para procurar palavras num texto de partida e compará-las com bases de dados gigantescas (milhares de milhões de palavras) de textos já traduzidos na língua de chegada. Para além de traduzir palavras isoladas, o computador pesquisa sequências de palavras, ou strings, um processo denominado correspondência (string matching). Com os avanços nos mais recentes métodos da tradução automática, os computadores conseguem presentemente não só encontrar correspondências diretas, como também pesquisar o contextos de cada frase tendo por base as frases que a rodeiam. Tal ajuda a lidar com ambiguidades que podem resultar com palavras como right, que tanto pode indicar uma direção, manifestar um direito, ou ainda significar “correto” ou “justo”. A capacidade das ferramentas CAT de acederem a bases de dados de TA, de MT e a glossários para sugerirem traduções revela a IA a todo o gás..

A inclusão da TA nas ferramentas CAT

As sugestões de tradução que provêm das MT e das bases de dados de TA estão integradas nas ferramentas CAT predominantemente de duas formas. Numa, o software sugere uma tradução para a totalidade do segmento que está a ser trabalhado, ou seja, para toda a frase. O/a tradutor/apode aceitar, recusar ou reformular a sugestão. Este procedimento é frequentemente denominado de post-editing, ou seja, pós-edição. O outro método implica uma tradução automática neuronal (ITM, interactive machine translation). Neste caso, o software recorre às mesmas fontes, mas vai mostrando os resultados em tempo real sob a forma de complementos, tal como no reconhecimento de texto. As investigadoras de tradução  Anna Zaretskaya, Gloria Corpas Pastor e Miriam Seghiri explicam: “A cada letra datilografada, são calculadas sugestões e os/as utilizadores/as podem, através de uma tecla específica, aceitá-las ou, continuando a escrever, recusá-las. Desta forma, o sistema atualiza constantemente as sugestões enquanto o/a utilizador/a escreve”, ou seja, o software aprende durante o processo.

Uma outra ferramenta CAT, Lilt, apresenta-se assim:
Proposta de tradução em tempo real no Lilt
Proposta de tradução em tempo real no Lilt | Roy Youdale | Smartcat | CC-BY-SA
Sugerindo soluções que talvez não lhe ocorressem, o sistema pode ter resultados positivos na criatividade do/a tradutor/a. Por outro lado, alguns/algumas tradutores/as sentem-se antes pressionados a aceitar as sugestões automáticas, o que, por seu turno, lhes limita a criatividade.

Tradutores/as literários/as e ferramentas CAT

A maioria dos/das tradutores/as literários/as não utiliza qualquer ferramenta CAT ao traduzir. Na opinião destes, estas ferramentas não se adequam a textos literários, sendo que muitos também não gostam de trabalhar num interface em que o texto é fragmentado em frases isoladas, privando-os do contexto do parágrafo, de uma página ou de um capítulo, o qual tem muitas vezes um papel determinante no desenrolar da narrativa. Também é comum recusarem a TA na literatura apontando a má qualidade dos resultados em programas como o Google Translate e são da opinião que os/as tradutores/as precisam saber e entender muito mais do que somente o significado das palavras apresentadas, nomeadamente, contextos culturais, políticos e históricos, expressões idiomáticas e tudo o que constitui conhecimentos práticos.

Contudo, aparentemente esta posição tem vindo a mudar e são sobretudo os/as tradutores/as literários/as mais jovens que se mostram recetivos a experimentar as ferramentas CAT. Embora seja verdade que, nas traduções literárias, onde as repetições raramente se verificam, a não repetição de frases completas mal se nota, as outras funcionalidades das ferramentas CAT podem ser utilizadas praticamente em todos os tipos de traduções. Estas incluem
  • encontrar facilmente o último fragmento trabalhado após uma pausa, diminuindo a probabilidade de saltar uma frase (o que, surpreendentemente, acontece com facilidade);
  • consultar versões anteriores dos segmentos terminados, de modo a que a última versão possa ser mais compreensível e, em caso de necessidade, possa voltar a ser trabalhada;
  • poder procurar uma tradução para verificar como se traduziu uma determinada palavra ou frase;
  • exportar uma tradução em diferentes formatos, como sejam uma tabela ajustada às frases ou um documento de Word normal.

Conclusão

[Uma definição de inteligência artificial diz:] teoria e desenvolvimento de sistemas informáticos que consegue efetuar tarefas que, habitualmente, requerem inteligência humana, tais como perceção visual, reconhecimento linguístico, tomada de decisões e tradução de línguas.

Apesar de um computador (ainda) não fazer jogos de palavras, nem ter noção dos registos linguísticos (níveis de formalidade ou informalidade), é muito competente na contagem e categorização de palavras e em extensas buscas automáticas por correspondências. Ele consegue apoiar os/as tradutores/as literários/as no seu trabalho tanto de modo parcial como totalmente automatizado. Onde, quando e como a IA e a informática serão aplicadas à tradução literária é uma área ainda pouco desenvolvida denominada CALT (computer-aided literary translation ou tradução literária assistida por computador) e que se ocupa com o permanente, frágil e instável equilíbrio entre humanos e máquinas. Parece assim apropriado refletir sobre o estado atual desse equilíbrio.


Glossário de Termos:


Fontes:

Boase-Beier, J. (2010) Stylistic Approaches to Translation. 3rd edn. London and New York: Routledge.

Chan, S.-W. (2015) ‘Computer-aided translation: major concepts’, in Chan, S.-W. (ed.) The Routledge Encyclopedia of Translation Technology. London and New York: Routledge, pp. 32–67.

Doherty, S. (2015) ‘The Impact of Translation Technologies on the Process and Product of Translation’, International Journal of Communication, 9 (February), pp. 1–23. doi: 10.1300/J009v26n03_04.

Eagleton, T. (2014) How to Read Literature. New Haven and London: Yale University Press.

Garcia, I. (2015) ‘Computer-aided translation: systems’, in Chan, S.-W. (ed.) The Routledge Encyclopedia of Translation Technology. London and New York: Routledge, pp. 68–87.

Lombardino, R. (2014) Why I Use A CAT Tool To Translate Books, eWordNews.

Melby, A. and Wright, S. (2015) ‘Translation Memory’, in Chan, S.-W. (ed.) The Routledge Encyclopedia of Translation Technology. London and New York: Routledge, pp. 662–677.

O’Hagan, M. (ed.) (2020) The Routledge Handbook of Translation and Technology. Abingdon and New York: Routledge. doi: 10.4324/9781315311258.

Prachi, K. ‘An Introduction to N-grams: What Are They and Why Do We Need Them?’

Rothwell, A. and Youdale, R. (forthcoming) ‘Computer-Assisted Translation (CAT) tools, translation memory and literary translation’, in Deane-Cox, S. and Spiessens, A. (eds.) The Routledge Handbook of Translation and Memory. London and New York: Routledge.

Ruffo, P. (2018) ‘Human-Computer Interaction in Translation : Literary Translators on Technology and Their Roles’, in Proceedings of the 40th Conference Translating and the Computer. London: AsLing, pp. 127–131.

Schiaffino, R. (2016) CAT tools and translation style, About Translation. Available at: http://www.aboutranslation.com/2016/04/cat-tools-and-translation-style.html.

Slessor, S. (2020) ‘Tenacious technophobes or nascent technophiles? A survey of the technological practices and needs of literary translators’, Perspectives. Taylor & Francis, 28 (2), pp. 238–252. doi: 10.1080/0907676x.2019.1645189.

Wasaty.pl (2019) ‘Literary translations with CAT tools’. October 20.

Youdale, R. (2020) Using computers in the translation of literary style: challenges and opportunities. London & New York: Routledge.

Zaretskaya, A., Pastor, G. and Seghiri, M. (2015) ‘Integration of machine translation in CAT tools: State of the art, evaluation and user attitudes’, SKASE Journal of Translation and Interpretation, 8 (1), pp. 76–88.