Производители

PROMT создаем шаблоны для переводов

Лидером рынка программного обеспечения машинных переводов с разных языков в России и в ряде стран мира является отечественная система PROMT. Это комплексный переводчик, объединяющий в одном дистрибутиве несколько инструментов для перевода.

Системы машинного перевода – один из наиболее востребованных в последнее время сегментов программного обеспечения. Связано это, прежде всего, с обилием информации, с которой работает пользователь (как домашний, так и корпоративный), представленной на иностранном языке. Ради того, чтобы получить перевод того или иного документа, конечно, можно прибегнуть к услугам специалистов, однако подобная практика обойдется в довольно внушительную сумму, а результат будет получен далеко не скоро. Тем не менее, использовать машинные переводчики для «простого» перевода текста по принципу «скопировал-нажал кнопку «перевести» необходимо тоже грамотно. Такие системы настроены преимущественно на работу с максимально обобщенными словарями и «рафинированными» грамматическими конструкциями. Если же перед вами находится текст с использованием сложной или специализированной лексики, при этом он написан с применением сложной грамматики, то машинный переводчик в любом случае придется настраивать для получения адекватных результатов.

Лидером рынка машинных переводов с разных языков в России и в ряде стран мира является отечественная система PROMT. Это комплексный переводчик, объединяющий в одном дистрибутиве несколько инструментов для перевода. В сегодняшнем мастер-классе мы рассмотрим главный из них, лингвистический редактор PROMT (где и происходят основные операции), при этом сделаем акцент на то, как именно в этом приложении создаются шаблоны для перевода. В материале задействована последняя на текущий день версия продукта 9.0 в редакции Professional.

Что такое шаблон?

Как уже говорилось выше, машинный переводчик всегда по умолчанию настроен на использование неких усредненных правил перевода текста. Он не сможет без дополнительной настройки перевести текст с использованием специальных терминов (они останутся или непереведенными, или, если это дополнительные значения известных слов, то вместо корректного перевода будет выставлен распространенный вариант) и написанный по определенной схеме (со сложным согласованием времен, косвенной речью и пр.). По этой причине обычно из ненастроенного под специализированную лексику переводчика «выходят», как минимум, искаженные тексты, из которых еще можно более-менее понять, где произошла ошибка. Однако если масштаб перевода слишком большой, то использовать ненастроенный переводчик бессмысленно. В этом случае потребуется создать так называемые «шаблоны» перевода, согласно которым система сможет, по крайней мере, использовать нужные схемы и сократит рутинную работу по правке итогового результата. Обычно в шаблон включают имена собственные, аббревиатуры и акронимы, устойчивые выражения, специализированные термины. Посмотрим, как можно создать такой шаблон в PROMT.

Подготовка к созданию

В PROMT 9.0 за создание шаблонов отвечает специальная утилита, которую можно вызвать из общей оболочки из раздела «Настройка перевода». В переводчике «шаблоны» именуются «тематиками», которые представляют собой совокупность настроек системы при использовании того или иного направления перевода. К ним относятся: подключенные словари, зарезервированные слова, базы Translation Memory (специально подготовленные образцы перевода, которые могут распознаваться в исходном тексте и подставляться в перевод с учетом правил перевода), перевод устоявшихся слов, выражений и фраз, правила транслитерации незнакомых слов, а также препроцессоры (то есть, правила обработки текста, выявляющие те части, которые должны оставаться без перевода, например, формулы, смайлики, спецсимволы).

По умолчанию после установки переводчика создается один общий «профиль» на каждом из направлений перевода, к которому подключается словарь общей лексики, стандартные препроцессоры (распознающие смайлики и некоторые типы сокращений), а также обобщенные правила переводов (например, то, как переводятся местоимения it и you в английском языке). Соответственно, пользователь вправе создать свою «тематику» или внести изменения в общую. Для этого нужно выбрать в оболочке направление перевода и нажать на кнопку «редактировать». В появившемся окне отобразится список существующих тематик, а также относящиеся к ним настройки по вышеуказанным составляющим. «Тематики» можно переименовывать, удалять (за исключением«общей лексики», создаваемого при установке PROMT), сохранять в архив и импортировать из него (если требуется переустановка программы). При создании «тематики» пользователь может выбрать построения ее на базе существующей тематики или начать формировать ее полностью с нуля.

Заметим, что в PROMT 9.0 появилась еще одна опция, относящаяся к свойствам тематики – «ключевые слова». Это те слова и словосочетания, которые позволяют машинному переводчику автоматически переключиться на наиболее подходящую тематику при переводе. Соответственно, эти параметры также потребуется заполнить уже на этом шаге (базовый набор терминов уже есть). Важно отметить, что чем больше ключевых слов будет указано, тем лучше программа будет справляться с автовыбором тематики, что будет отражаться на качестве перевода. Список «ключевиков» можно импортировать из файла.

Включаем словари

Итак, первый шаг к формированию непосредственно самой тематики – это включение используемых в ней словарей. С PROMT 9.0 поставляются несколько словарей (общая лексика, интернет и пр.), однако пользователь вправе приобрести дополнительные коллекции словарей (созданные разработчиком системы) или включить свои собственные, разработанные пользователем. Подчеркнем, что для адекватного перевода текста в тематике должны использоваться именно подходящие к ней словари, в противном случае, возможны искажения перевода или «захламление» итогового текста дополнительными значениями, не относящимися к оригиналу. Система словарей в PROMT устроена следующим образом – машинный переводчик ищет перевод слова в самом первом из подключенных словарей, переходя от словаря к словарю. Соответственно, существует приоритет – если речь идет о тексте со специальными терминами, то эти словари должны быть подключены и установлены выше, чем словарь общей лексики. При переустановке программы словари можно сохранять в резервные копии и восстанавливать их потом. Для повышения качества перевода очень важен собственный словарь, составляемый пользователем. Кроме того, он всегда имеет высший приоритет при переводе.

целесообразно все-таки оставлять некоторые слова и словосочетания в оригинале – обычно это имена собственные, некоторые понятия и так далее. В PROMT есть возможность сохранения их в оригинальном написании или принудительная транслитерация. Они могут выделяться в тексте другим шрифтом (так, например, допустим курсив), плюс есть функция указания принадлежности слова к тому или иному семантическому классу (чтобы не получались ошибки при переводе глаголов и существительных, которые написаны одинаково). Для этого нужно вызвать диалоговое окно добавления резервированных слов и внести их по одному или импортировать из WWT-файла.  

Редактируем словари

Выше мы отмечали, что в PROMT могут использоваться пользовательские словари. Речь идет о том, что переводчики могут создавать собственные коллекции переводов – для этого в программе есть соответствующий редактор. Он работает в двух режимах – простом и расширенном. В первом случае пользователю потребуется в диалоговом окне внести саму слова, выбрать часть речи этого слова, после чего подтвердить включение в базу перевода (устанавливается флажок) и закрыть окно. Если такое слово или словосочетание уже есть в базе, то будет выведено соответствующее предупреждение и откроется ячейка на редактирование.

В расширенном режиме опций намного больше. Во-первых, в этом случае пользователь может указывать, как изменяется (например, склоняется) это слово, во-вторых, указать его роль в грамматических конструкциях (управление). Для работы в расширенном режиме потребуется соблюдение следующих (тривиальных по своей сути) правил: добавления глаголов в начальной форме (инфинитивы), существительных и прилагательных в мужском роде, единственном числе, для причастий – глагол, от которого они образованы, писать все слова с прописных букв (кроме имен собственных и существительных в немецком языке), разделять пунктуационные знаки во фразах пробелами, писать перевод от главного слова в словосочетании. Для изменяемых частей речи автоматически будет открыты настройки их склонений с возможной подстановкой стандартных вариантов с возможностью ручной правки всех вариантов склонения. Аналогично производится внесение данных по управлению словами в предложениях – употребление с предлогами, глаголами и так далее.

Translation Memory (перевод фрагментов по образцам)

В шаблонах машинного переводчика может использоваться и технология Translation Memory – применение баз переведенных текстов с устоявшейся терминологией, лексическими конструкциями и так далее. О том, что это такое, мы расскажем во втором мастер-классе, посвященном улучшению качестве перевода в PROMT, а пока ограничимся описанием возможностей на примере готовых баз TM. В PROMT есть соответствующая закладка в формировании тематики, позволяющая подключать к нему TM, указывая правила их использования (например, точность совпадения в тексте – по умолчанию установлено на 100%, правило замены существующего написания (знаков пунктуации, регистра слов, форматирования текста и пр.).

Дополнительная обработка

В текстах на иностранном языке часто могут встречаться предложения, состоящие из таких слов и выражений, которые не нуждаются в переводе. Машинный переводчик, таким образом, должен их или пропускать, или правильно обрабатывать. К ним относятся, например, адреса электронной почты и веб-сайтов, системные пути (названия файлов и папок), даты и время, смайлики и так далее. В общей тематике включены по умолчанию два препроцессора, которые отслеживают вышеперечисленные элементы текста.

Близко к этому примыкают и правила перевода. Они различаются от языка к языку и относятся к определенным речевым конструкциям, имеющим множественный перевод. В английском языке это связано, например, с переводом местоимений you и it  - соответственно, «ты» или «Вы», «это» или «эта» (в конструкции It is… – это/эта естьВ настройках также можно активировать режим принудительной транслитерации всех незнакомых слов.

PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT PROMT

Заключение

Мы рассмотрели базовые возможности создания шаблонов перевода в PROMT. Вышеперечисленные инструменты позволяют пользователю-переводчику использовать готовые решения, входящие в состав системы машинного перевода для своей деятельности. Мы не описали более продвинутые возможности работы с утилитами, оставив их для следующего мастер-класса по улучшению качества перевода. Купить PROMT Professional 9.0 можно у партнеров 1Софт.

Павел Шубин

Все права защищены. По вопросам использования статьи обращайтесь к администраторам сайта