Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Проблемы МП.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
143.87 Кб
Скачать

На втором этапе стал использоваться термин автоматизированный перевод.

В современной форме идея АП была развита в статье Мартина Кея 1980 года[2], который выдвинул следующий тезис: «by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human» (компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления).

НА СОВРЕМЕННОМ ЭТАПЕ РАЗЛИЧАЮТ:

В настоящее время различают три вида систем АВТОМАТИЗИРОВАННОГО перевода:

1. Системы на основе грамматических правил (RuleBased Machine Translation, RBMT);

2. Статистические системы (Statistical Machine Translation, SMT);

3. Гибридные системы;

Системы на основе грамматических правил производят анализ текста, который используется в процессе перевода. Перевод производится на основе встроенных словарей для данной языковой пары, а так же грамматик, охватывающих семантические, морфологические, синтаксические закономерности обоих языков. На основе всех этих данных исходный текст последовательно, предложение за предложением, преобразуется в текст на требуемом языке. Основной принцип работы таких систем — связь структур исходного и конечного текстов. Преимуществами систем на основе грамматических правил являются грамматическая и синтаксическая точность, стабильность результата, возможность настройки на специфическую предметную область. К недостаткам систем на основе грамматических правил относят необходимость создания, поддержки и обновления лингвистических баз данных, трудоемкость создания такой системы, а так же ее высокая стоимость.

Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT). Основной принцип работы состоит в связи структур исходного и переводимого текста. Перевод осуществляется на базе встроенных словарей, грамматике, охватывающей морфологические, синтаксические и семантические закономерности исходного и переводимого текста. На основе этих данных исходный текст последовательно преобразуется в текст на требуемом языке.

Статистические системы при своей работе используют статистический анализ. В систему загружается двуязычный корпус текстов (содержащий большое количество текста на исходном языке и его «ручной» перевод на требуемый язык), после чего система анализирует статистику межъязыковых соответствий, синтаксических конструкций и т. д. Система является самообучаемой — при выборе варианта перевода она опирается на полученную ранее статистику. Чем больший словарь внутри языковой пары и чем точнее он составлен, тем лучше результат статистического машинного перевода. С каждым новым переведенным текстом улучшается качество последующих переводов. Статистические системы отличаются быстротой на- стройки и легкостью добавления новых направлений перевода. Среди недостатков наиболее значительными являются наличие многочисленных грамматических ошибок и нестабильность перевода.

Статистические системы (Statistical Machine Translation, SMT). Статистический машинный перевод - это разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар. Языковые пары - тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком - носителем двух языков, так и переводом с исходного на язык перевода, выполненный человеком. Таким образом статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучший результат статистического машинного перевода.

Гибридные системы сочетают в себе подходы, описанные ранее. Ожидается, что гибридные системы машинного перевода позволят объединить все преимущества, которыми обладают статистические системы и системы, основанные на правилах.

В настоящее время наиболее распространенными способами использования компьютеров при письменном переводе является работа со словарями и глоссариями, памятью переводов (англ. Translation Memory, TM), содержащей примеры ранее переведенных текстов, терминологическими базами, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что дает сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.

ТМ – это база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ. А в результате нет необходимости дважды переводить одно и то же предложение.

С другой стороны, при работе с крупными проектами переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются.

CAT-tools (от английского Computer Aided or Assistant Translation) представляют собой средства автоматизированного перевода. Отличие CAT-tools от программ машинного перевода (например, Promt или Google Translate) состоит в том, что они не пытаются заменить переводчика, а лишь помогают его деятельности, унифицируя перевод лексики и облегчая работу над текстами повторяющейся тематики. В настоящее время базы памяти переводов являются уникальным продуктом, представляющим огромную ценность, особенно для специалистов перевода технических текстов. В таком случае при работе нескольких переводчиков над одним проектом не стоит опасаться того, что слово «motor» будет переведено в одном случае как «двигатель», а в другом как «мотор» - работа с CAT-инструментами помогает сохранить единообразие перевода. Подобные программы также позволяют существенно сократить время на перевод технических текстов за счет того, что больше не придется переводить одинаковые сегменты текста - осуществив перевод лишь один раз, в будущем программа сама будет подставлять перевод к уже переведенным частям документа. Польза от использования средств CAT-tools неоспорима, остается только научиться работать с конкретными программами, каждая из которых имеет свои особенности.

Наиболее мощным продуктом и беспрекословным лидером среди программ автоматизированного перевода является SDL Trados.

При этом бесспорным остается тот факт, что знание средств CAT-tools на сегодняшний день является не просто еще одним дополнительным требованием переводческих фирм - это ключевой аспект выживания переводчиков на конкурентном рынке труда.

НАИБОЛЕЕ ИЗВЕСТНЫЕ СИСТЕМЫ МАШИННОГО ПЕРЕВОДА:

Google Translate

Google Translate — система, в настоящий момент раз-

рабатываемая компанией Google. Первоначально разра-

батывалась Franz Josef Och. Построена на статистическом

методе перевода. Для обучения системы первоначально

использовались параллельные корпуса текстов ООН,

представленные на шести официальных языках ООН.

Данная система не осуществляет прямой перевод для

языковых пар, в которые не входит английский язык. То

есть, при переводе, например, с русского языка на фран-

цузский, сначала будет осуществлен перевод с русского на

английский язык, а после этого — с английского на фран-

цузский.

Более того, для некоторых языков таких шагов больше.

Например, тексты на белорусском языке вначале пере-

водятся на русский, после этого на английский и только

потом превращаются в текст на конечном языке. Это зна-

чительно снижает точность перевода и делает систему аб-

солютно непригодной для перевода ряда текстов.

Прочтите текст:

http://mozgorilla.com/analytics/na-kakoj-yazyk-luchshe-vsego-perevodit-google-translate/