Быстрый доступ:
Перейти к содержанию (Alt 1)Перейти к навигации второго уровня (Alt 3)Перейти к навигации первого уровня (Alt 2)

Машинный перевод
Многоязычность в контексте машинного перевода

Нейронные связи
Машинное глубокое обучение ориентировано на создание новых нейронных связей | Фото: Callista © plainpicture

В последние годы машинный перевод стал более эффективным благодаря новым разработкам в области искусственного интеллекта. В чем особенности этой технологии? Каковы ее преимущества и возможные последствия для качественного лингвистического образования?

Von Ральф Крюгер

Если вы недавно использовали систему машинного перевода, например, Google Переводчик, то наверняка были приятно удивлены качеством перевода. Если раньше система выдавала исключительно непонятные конструкции с досадными ошибками, вызывающими порой улыбку, порой недоумение, то современное программное обеспечение предлагает переводы, которые не только верно передают содержание исходного текста, но и учитывают стилистику языка. Что же изменилось?

Победное Шествие Нейронных Сетей

Ответ кроется в новейших успешных разработках в области искусственного интеллекта, которые базируются на использовании так называемых искусственных нейронных сетей. Идея воссоздать с помощью вычислительных машин структуру человеческого мозга с миллиардами связанных между собой нервных клеток (нейронов) в виде искусственных сетей появилась уже в 1940-х годах. Однако лишь недавно были достигнуты два важнейших условия для реализации этой идеи: достаточно высокая вычислительная мощность и возможность доступа к большим массивам данных (Big Data), с помощью которых можно тренировать нейронные сети. Этот подход, называемый глубоким обучением, кардинально отличается от прежних методов работы с искусственным интеллектом, когда осуществлялись попытки выполнить поставленные задачи, исходя из четко запрограммированных наборов правил. Искусственные нейронные сети анализируют определенные шаблоны или закономерности в массивах данных и выводят свои собственные, недоступные для понимания человека, правила для решения конкретной задачи.

Описанные выше противоположные подходы и сегодня используются и в машинном переводе. Так называемый машинный перевод на основе правил анализирует предложение на исходном языке строго в соответствии с заранее заданными правилами грамматики и лексики и генерирует перевод, опираясь на соответствующие правила целевого языка. Однако естественные языки – это необычайно сложные структуры, и в отличие от языков программирования они демонстрируют лишь относительную регулярность и характеризуются многочисленными исключениями, а в некоторых случаях даже противоречиями. Поэтому успех данного подхода весьма скромный. При нейронном машинном переводе нейронная сеть работает с привлечением большого количества исходных текстов и их переводов и извлекает из этих данных определенные шаблоны. При этом как будто создается искусственный мозг переводчика, который учится самостоятельно переводить новые тексты на основе сохраненных в памяти данных.

СОВРЕМЕННЫЙ УРОВЕНЬ МАШИННОГО ПЕРЕВОДА

Нейронная сеть Нейронные программы перевода формируют искусственный мозг переводчика. | Фото: Альфред Пасека © Mauritius images – Научная Фотобиблиотека Достижения нового подхода впечатляют. Нейронный машинный перевод был запущен всего лишь четыре года назад и в кратчайшие сроки превзошел по качеству прежние подходы. В марте 2018 года исследовательская группа Microsoft заявила, что их система нейронного перевода уже вышла на «человеческий уровень» при переводе газетных статей с китайского языка на английский, то есть по качеству перевод, выполненный машиной ни в чем не уступает переводу, выполненному человеком.

Однако такие заявления следует рассматривать с осторожностью и ни в коем случае не распространять их на все языковые направления и предметные области. В целом справедливым будет сказать, что даже нейронный машинный перевод небезупречен. Основную проблему представляет присущая естественным языкам неоднозначность. Люди всегда интерпретируют высказывания в определенном контексте. Так, например, из вырванного из контекста предложения «I arrived at the bank» невозможно понять, прибыл говорящий на берег реки или в финансовое учреждение. Слушателю для интерпретации, понимания нужен контекст. Машинный перевод не учитывает контекст и поэтому априори предрасположен к ошибкам. Следовательно, мечта об универсальном переводчике, с помощью которого можно преодолеть вавилонское смешение языков, пока не стала реальностью.

ПОЛЬЗА МАШИННОГО ПЕРЕВОДА ДЛЯ ОБЩЕСТВА

Несмотря на то, что машинный перевод до сих пор сталкивается с многочисленными проблемами, он является полезным инструментом для информативного перевода. Сегодня благодаря использованию смартфонов и других гаджетов пользователи в любое время имеют доступ к облачным службам перевода, таким как Google Переводчик, и могут использовать их для элементарного понимания иноязычных текстов. Интересной разработкой являются так называемые наушники-переводчики, например, Pixel Buds от Google. Эти беспроводные наушники используют распознавание речи, чтобы преобразовать иноязычное высказывание в машиночитаемый текст, а затем переводят его с помощью Google Переводчика на выбранный язык, и, наконец, воспроизводят результат, делая тем самым возможным применение машинного перевода для устного общения. Однако при этом значительно возрастает подверженность ошибкам из-за тройного преобразования: распознавания речи, перевода и речевого вывода. Кроме того, разговорная речь менее структурирована и сильно привязана к конкретной ситуации общения.

Помимо этого, на институциональном уровне предпринимаются усилия, чтобы использовать машинный перевод на благо общества. Так, Немецкий исследовательский центр по искусственному интеллекту планирует участие в финансируемом ЕС проекте «Человеческий язык» (The Human Language Project), который среди прочего направлен на то, чтобы расширить вовлеченность малообразованных, пожилых людей и мигрантов в жизнь многоязычной Европы путем развития языковых технологий. Кроме того, в настоящее время в рамках проекта ЕС INTERACT (International Network on Crisis Translation – Международная сеть по кризисному переводу) исследователи рассматривают возможность использования машинного перевода в стихийных бедствиях, когда решающее значение имеет максимально быстрое преодоление языкового барьера.
Диалоги людей Машина не способна распознать речевые нюансы и, следовательно, преодолеть языковые барьеры. | Фото: stm © photocase.de

О ПРЕИМУЩЕСТВАХ МНОГОЯЗЫЧНОСТИ

Вышесказанное наводит на мысль о том, что изучение иностранных языков в будущем станет удовольствием из разряда роскоши, которое смогут себе позволить только лингвисты-энтузиасты. Но это впечатление обманчиво. Мы уже описали проблемы качества, характерные для машинного перевода. А богатое нюансами общение между носителями разных языков, которое включает в себя не только лингвистическую, но и культурную составляющую, машина, вероятно, никогда не сможет освоить.

На фоне крайне заманчивой и многообещающей перспективы машинного перевода преимущества многоязычности становятся все более очевидными. Тот, кто отказывается от изучения иностранного языка хотя бы на базовом уровне и знакомится с иностранными культурами, опираясь исключительно на машинный перевод, не только отрицает прямое и непосредственное общение с другими людьми, но и запирается в рамках своего собственного языка. Ведь при изучении нового языка мы открываем новый взгляд на мир, иной способ выразить реальность словами. Такая межкультурная эмпатия необходима современному глобализированному миру, ведь любое возможное недопонимание может легко привести к конфликту.

 

ЛИТЕРАТУРА

Крюгер, Ральф (2017): О сетях и векторах – нейронный машинный перевод. В MDÜ – Журнал для устных и письменных переводчиков, № 63. том 1.