Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОПЛ_ответы.doc
Скачиваний:
3
Добавлен:
01.05.2025
Размер:
1.07 Mб
Скачать

49. Системы прямого перевода, алгоритм прямого перевода.

Машинный перевод - процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой полностью специальной компьютерной программой.

Одна из классификаций МП говорит о существовании 3-х основных типов систем машинного перевода:

1. Системы, основанные на промежуточном языке (interlingua approach).

- исходят из возможности создания внеязыкового промежуточного семантико-синтаксического представления исходного текста, пригодного для его воплощения средствами нескольких языков;

- происходит в 2 этапа:

* с языка А на внутренний (вспомогательный) язык L; * с L на язык В.

при этом применяется 2 набора правил (R1 и R2).

- достоинства:

* многократное использование при переводе с определенного исходного языка;

* пригодность для работы с текстом на любом языке.

2. Системы, основанные на трансфере (transfer-based)

- предполагают 3 стадии перевода, включающие глубинную (абстрактную, семантико-синтаксическую) репрезентацию текста как для исходного языка (ИЯ), так и для языка перевода (ПЯ).

3. Системы «прямого перевода» (direct translation).

- обычно двуязычны, специально разработаны для конкретной пары языков и пригодны для перевода только в одном направлении (т.е. не способны восстановить из переводного текста исходный);

- элементы текста на языке А заменяются на элементы текста на языке В по набору правил R.

Т.е. перевод производится напрямую: система включает большой двуязычный словарь и программу анализа и генерирования текстов. Анализ исходного текста настолько подробен, насколько это необходимо для создания его переводного эквивалента на заданном языке, и не более того.

Алгоритм прямого перевода:

Наиболее распространенной является следующая последовательность формальных операций:

1. Ввод текста и поиск входных словоформ.

На этом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например, дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова м.б. получены также сведения, относящиеся к другим уровням организации языковой системы.

2. Перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области.

Этот этап включает в себя:

- перевод идиоматических словосочетаний и фразеологических единств, штампов предметной области (например, обороты in case of, in accordance with исключаются из дальнейшего грамматического анализа);

- определение основных характеристик элементов входного текста, производимое в рамках входного языка:

* грамматических * морфологических * синтаксических

* семантических * лексических

- разрешение омографии (конверсионной омонимии словоформ, например, round м.б. и существительным, и прилагательным, и наречием, и глаголом, и предлогом)

- лексический анализ и перевод лексем

Обычно на этом этапе однозначные слова отделяются от многозначных, после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие \ отсутствие контекстных определителей значения.

3. Грамматический анализ.

На этом этапе доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, при том, что в оригинале м.б. и единственное число).

4. Синтез выходных словоформ и предложений.

На этом этапе генерируется выходной текст с учетом информации, собранной на предыдущих этапах.