自动翻译 自动翻译给多语教育带来希望

自动系统的“深度学习”效仿了神经细胞网络的运行方式
自动系统的“深度学习”效仿了神经细胞网络的运行方式 | Photo: Callista © plainpicture

近些年来,随着人工智能研究的不断推进,自动翻译系统也变得越来越强大。这种技术是如何运作的,它有哪些用处,将为多语教育理想的实现带来哪些影响?

最近使用过GOOLGE翻译这类自动翻译系统的人,很可能会对译文水准大吃一惊。如果说过去的翻译软件给出的答案要么千奇百怪不知所云,要么错漏百出令人捧腹,那么现在的翻译软件不仅能传达原文内容,其语言水平也着实令人刮目相看——这期间究竟发生了什么?

高歌猛进的神经网络

答案就在近年来随着人工神经网络的应用而取得了飞速进步的人工智能的研究中。早在上世纪四十年代,科学家就产生了模仿由数以亿计的神经细胞(神经元)相连而组成的人脑结构,在计算机内部建造一个人造网络的想法,但直到最近,实现这一构想的两个最重要的前提——即足够强大的计算能力和可用于训练神经网络的庞大数据(大数据)才得以满足。这种又名 “深度学习”的方法,与之前应用于人工智能领域的方法截然不同,后者试图基于明确编定的规则来完成所需解决的任务。相反,人工神经网络则是根据特定模式或规律性来对大数据进行分析,从中导出用于完成某个既定任务的特有规则,这些规则大多是人脑所无法理解的。

上述两种截然相反的应用在自动翻译系统中也同样存在。所谓“基于规则的自动翻译系统”严格按照给定语法和词典中的语言规范对原文语句进行分析,再结合相应的目标语言规则生成译文。但自然语言是一种极其庞杂的结构,和程序语言相反,它所表现出的规律性十分有限,除包含了大量特例以外,一部分自然语言还具有自相矛盾的特征。相比之下,这种基于规则的翻译方法所获得的成功简直微不足道。而神经机器翻译则相反,神经网络利用大量原文和相应的译文进行训练,从大量数据中提炼出特定的翻译模式。理论上,它相当于一个能够利用输入系统中的数据来学习如何翻译新文章的人造翻译大脑。

机器翻译当前可以达到的水平

神经翻译软件相当于一个人造的译者大脑。 神经翻译软件相当于一个人造的译者大脑。 | Foto: Alfred Pasieka © mauritius images - Science Photo Library 这一全新方法取得了引人瞩目的成就。四年前才呱呱坠地的神经机器翻译,在译文质量方面已经迅速超越了之前的所有方法。2018年3月,微软的一个研究小组甚至宣称,该公司研发的神经翻译系统所提供的中译英新闻翻译已达到“人类水平”,也就是说,在质量方面完全不亚于人工翻译。

但对于这样的说法应当抱以谨慎态度,不可将其推而广之到所有的语言方向和专业领域。普遍而言,即使是神经机器翻译也仍然面临着一些根本性的挑战。自然语言所内在的多义性便是其中的一个关键。人类在对语言表述进行阐释时总是会结合具体的语境。比如从“I arrived at the bank”这句话本身是无法判断说话者此刻是抵达了河岸边还是银行的,听者必须根据对话情境来对这一表述进行分析。相反,机器翻译因无视上下文,理论上很容易出现错误。所以在现实中,通过“万能翻译机”来克服“巴比塔”现象,还是一个遥不可及的梦想。

造福社会的机器翻译

尽管机器翻译仍有许多尚未突破的难点,但在信息翻译方面仍不失为一种有效的工具。如今,连网智能手机等移动设备的用户可以随时打开“Google Übersetzer”等一些基于云端的翻译软件,根据结果推断出一段外文的大意。谷歌“Pixel Bud”所代表的“In-Ear-Übersetzer”,则是一项颇为有趣的新发明。这类无线式头戴可以通过语音识别软件将外文转换为系统可以识别的文本,再由“Google Übersetzer”翻译为目标语言后通过语音系统重新输出。由此一来,翻译软件便成为一种可以用于口头交流的工具。但由于受语音识别、翻译和语音输出这三重“瓶颈”的影响,再加上日常交际总是与情境密不可分,而口语的句法结构又趋向于松散,导致软件的出错率大大增加。

此外,各国政府也在积极尝试利用机器翻译这项发明来造福社会。例如德国人工智能研究中心便正在计划申请一项由欧盟资助的“Human Language Project”,该项目的目标之一是通过语言技术的深入研发来改善受教育程度较低的人群、老年人和具有移民背景的群体对欧洲语言多样化的参与。此外,欧盟项目“INTERACT”(危机翻译国际网络)的科学家们也正在研究机器翻译在需要尽可能快速突破语言障碍实现交流的灾变环境中的可用性。

超越语言的微妙交流是机器难以企及的。 超越语言的微妙交流是机器难以企及的。 | Foto: stm © photocase.de

掌握多种语言的益处

从以上种种很容易得出一个结论,那就是外语在未来将成为一项只有语言天才才会去从事的高端娱乐活动。然而这只是一种错觉。上文已对机器翻译仍旧存在的质量问题做过讨论,在此不再赘述。不同语言的说话者之间那种丰富而微妙的交流,不仅是一种语言交际,同时也是一种文化交流,它是不可能在未来某一天被机器所取代的。

尤其与看似便利的机器翻译相比,多语能力更是一种显而易见的优势。如果一个人不掌握外语,不具备哪怕是最基本的外语常识,而是指望凭借一台机器来了解外国文化的话,那么他不仅无法与别人进行没有任何屏障的直接交流,还会像身陷囹圄的囚徒一样受困于自己的语言。因为人们在学习一门外语的同时,也是在开启一种新的眼光和视角,接受一种完全不同的,用语言来理解和表述现实的方式。尤其在充满各式各样的误解、冲突频发的全球化时代,这种跨文化感受力更是一种不可或缺的素质。
 

参考文献

Krüger, Ralph (2017): Von Netzen und Vektoren – Neuronale Maschinelle Übersetzung. In: MDÜ – Fachzeitschrift für Dolmetscher und Übersetzer, 63. Jg., H. 1.