Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Проблемы МП.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
143.87 Кб
Скачать

Яндекс.Перевод

Яндекс.Перевод представляет собой сервис автомати-

ческого перевода слов, фраз, целых текстов, а так же веб-

страниц. Как и Google Translate, Яндекс.Перевод исполь-

зует статистический перевод. Яндекс.Перевод состоит из

двух частей — модели перевода и модели языка. Модель

перевода занимается построением графа, содержащего

все возможные варианты перевода предложения. Модель

языка выбирает лучший вариант перевода с точки зрения

оптимальной сочетаемости слов в естественном языке. []

Хотя список доступных для перевода языков у Яндекс.

Перевода значительно меньше, чем у Google Translate,

перевод осуществляется напрямую, без использования

промежуточных звеньев.

Abbyy Compreno

Abbyy Compreno — технология, разработанная рос-

сийской компанией «Abbyy», а также одноименная си-

стема, созданная ей же.

Для перевода система строит полное синтаксическое

дерево исходного текста. Для его построения она ис-

пользует отдельно заданные правила для каждого языка.

Причем Compreno способна правильно обрабатывать

анафоры, эллипсис и другие трудно поддающиеся обра-

ботке языковые конструкции. При переводе учитываются

связи между словами в этом дереве, возможное поло-

жение этих слов в USH (Universal Sematic Hierarchy —

иерархии универсальных семантических значений и отно-

шений между ними) а также статистика взаимоотношений

между словами.

Основным недостатком данной системы является её

закрытость, отсутствие данных о полномасштабных те-

стированиях данной системы, что делает невозможным

оценку качества производимого ей машинного перевода.

1.4.4. Основные области использования машинного перевода. Первоначаль­ные иллюзии об универсальности применения МП быстро рассеялись. Собственно, и спрос на машинный перевод художественных текстов практически отсутствовал.

1. Между тем область текстов научно-техниче­ской информации настолько велика, что человеческий перевод просто не в состоянии ее охватить. В службах научно-технической информации различных ведомств и организаций использование систем МП показало высокую эффективность. Требования к качеству перевода оказались до­вольно низкими, что позволило использовать в этой сфере системы МП первого поколения.

2. Вторая сфера применения МП — крупные меж­дународные организации, использующие документы на многих языках. К числу таких организаций относится, например, ООН и официальные структуры Европейского Союза, в которых документы должны появляться практически одновременно на всех языках членов ЕС. Однако требования к качеству перевода здесь довольно высоки и этап постредактирования необходим даже для систем МП с хорошими характеристиками.

3. Третья большая область использования МП — техническая докумен­тация. Экспорт продукции — особенно высокотехнологичной — требует перевода больших массивов технических описаний и инструкций. Так, эксплуатационная документация к самолетам достигает 100 и более тыс. страниц. Компании, связанные с экспортом, готовы даже нормиро­вать внутренний язык, используемый для технической документации, чтобы облегчить автоматический перевод этих документов на выход­ной язык. Например, в Европейской ассоциации авиапроизводителей (European Association of Aerospace Manufactures) под руководством Ван Дейка был разработан специальный стандарт АЕСМА «упрощенного ан­глийского языка», налагающий серьезные ограничения на используемую в документации лексику и синтаксические конструкции. Этот стандарт используется, в частности, в корпорации «Боинг» (см. по этому поводу [Wojcik 1997]).

В целом можно сделать вывод, что в настоящее время системы МП успешно функционируют в тех областях, где либо не требуется абсолютная точность перевода, либо существуют существенные огра­ничения на использование структур естественного языка, где входной язык нормирован и упрощен. К числу проблемных областей последнего типа относится, например, подъязык метеосводок. В Канаде с 1975 г. в промышленном режиме функционирует система МП TAUM-METEO, переводящая тексты метеосводок с английского языка на французский.

Автоматизированный перевод — это широкое и не совсем точное понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:

  • Программы для проверки правописания, которые могут быть встроены в текстовые редакторы или дополнительные программы;

  • Программы для проверки грамматики, которые также встраиваются в текстовые редакторы или дополнительные программы;

  • Программы для управления терминологией

  • Словари на компакт-дисках, одноязычные или многоязычные;

  • Программы для полнотекстового поиска (или индексаторы), которые позволяют пользователю обращаться с запросами к ранее переведенным текстам или разного рода справочным документам. В индустрии переводов известны такие индексаторы, как Naturel, ISYS Search Software и dtSearch;

  • Программы конкорданса, которые позволяют находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как например, битекст или память переводов;

  • Программное обеспечение для управления проектами, которое позволяет лингвистам структурировать сложные переводческие проекты, передавать выполнение различных задач разным сотрудникам и наблюдать за процессом выполнения этих задач;

  • Программы управления памятью переводов (TMM), состоящие из базы данных сегментов текста на исходном языке и их переводов на один или более целевых языков;

  • Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определенные изменения в сомнительных случаях. Иногда такие программы называют машинным переводом с участием человека.