
- •«Пермский национальный исследовательский политехнический университет»
- •Курсовая работа по дисциплине
- •Глава 4. Альтернативная классификация смп 16
- •Введение
- •1. Машинный перевод
- •Развитие машинного перевода
- •Степень реализации смп
- •Принципы оценки смп
- •Принцип действия смп
- •2. Подходы к машинному переводу
- •2.1 Смп, основанные на правилах
- •2.2 Пословный перевод
- •2.3. Трансфертные системы
- •Интерлингвистический машинный перевод
- •Системы машинного перевода, основанные на примерах
- •Двуязычные корпуса текста
- •Статистический машинный перевод
- •Модель Шеннона
- •Глава 4. Альтернативная классификация смп
- •4.2 Сравнение различных типов смп
- •4.3 Сравнение статистических и трансфертных смп
- •4.4 Обратный перевод
- •4.5 Сравнение двух статистических смп
- •Лексические особенности.
- •Синтаксические особенности.
- •Морфологические особенности.
- •Заключение
- •Основание практической части
- •Список использованных источников и литературы
Степень реализации смп
По степени разработанности отличают следующие классы СМП:
Принципы оценки смп
Сейчас достаточно очевидно, что невозможно заменить человека-переводчика машиной. Однако, можно сильно облегчить труд переводчика и повысить его производительность. Для того, чтобы судить на сколько труд переводчика стал эффективнее и проще использует следующие методы оценки СМП.
Наиболее адекватными являются субъективные и статистические методы. Но они применимы только для конкретной команды переводчиков и редакторов. И для каждого человека будут давать сильно разнящиеся показатели. Инженерные и программные методы позволят оценить СМП только на уровне конечного продукта. На уровне разработки пользы от них не много.
Принцип действия смп
Любая СМП в своей работе (на этапе эксплуатации) использует формальные шаги представленные на схеме.
2. Подходы к машинному переводу
Системы машинного перевода могут использовать метод перевода основанный на лингвистических правилах. Наиболее подходящие слова из исходного языка просто заменяются словами переводного языка.
Часто утверждается, что для успешного решения проблемы машинного перевода, необходимо решить проблему понимания текста на естественном языке.
Как правило, метод перевода основанный на правилах использует символическое представление (посредника), на основе которого создается текст на переводном языке. А если учитывать природу посредника то можно говорить об интерлингвистическом машинном переводе или трансфертном машинном переводе. Эти методы требуют очень больших словарей с морфологической, синтаксической и семантической информацией и большого набора правил.
Если у системы машинного перевода будет достаточное количество данных, то можно получить перевод хорошего качества. Основная трудность заключается в формировании этих данных. Например, большие корпуса текста необходимые для статистических методов перевода, для перевод основанного на грамматике оказываются недостаточными. Более того, для последних, требуется дополнительное задание грамматики.
Для перевода родственных языков (русский, украинский) может оказаться достаточной простая замена слов.
Современные системы машинного перевода делят на три большие группы:
основанные на правилах;
основанные на примерах;
статистические.
Далее мы рассмотрим эту классификацию подробнее.
2.1 Смп, основанные на правилах
Системы машинного перевода основанные на правилах – общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках в основном получены из (двуязычных) словари и грамматики, охватывающих основные семантические, морфологические, синтаксические и закономерности каждого языка. Такой подход к машинному переводу еще называют классическим.
На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода. Часто, такие системы противопоставляют системам машинного перевода основанных на примерах.
Основной принцип работы таких систем – связь структуры входного и выходного предложения.
Перевод при этом получается не особенно хорошего качества. Но на простых примерах работает.
Перевод с английского на русский будет выглядеть как:
A girl eats an apple.Девочка ест яблоко.
Эти системы делятся на три группы:
системы пословного перевода;
трансфертные системы;
интерлингвистические;