Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
F-15 history.docx
Скачиваний:
1
Добавлен:
10.12.2019
Размер:
100.75 Кб
Скачать

Московский Авиационный Институт

(государственный технический университет)

«Институт иностранных языков МАИ»

Кафедра И-01

«Теория и практика английского языка»

Курсовая работа

по предмету:

«Информационные технологии в переводоведении»

на тему:

«Анализ машинного перевода»

Выполнил:

Студент группы ИД-301БК

Рамазанов Вячеслав

Принял:

Демидова О.Л.

Москва 2012 г.

Оглавление

Вступление. История машинного перевода………………………………………………………………………………………3

Исходный текст……………………………………………………………………………………………………………………..……………5

Личный перевод……………………………………………………………………….…………………………………………..……………7

Перевод Google.translate……………………………………………………………………………………………………………………9

Перевод Promt (Translate.ru) ………………………………………………….………………………………………………..………14

Вывод…………………………………………………………………………………………………………………………………..…………….19

Используемая литература.………………………………………………….…………………………………..…………..………..…21

Вступление История машинного перевода

Машинный перевод - это автоматический перевод, перевод текста с одного языка на другой язык с помощью специальный компьютерных программ.

Мысль о возможности машинного перевода появилась у выдающегося математика Чарльза Бэббиджа (1791-1871), который уже в 1848 г. разработал проект механического прототипа электронных цифровых вычислительных машин, появившихся только через столетие. Первые программы машинного перевода появились в 50-х годах XX в., спустя несколько лет после появления первого компьютера( в январе 1954 г. состоялась первая публичная демонстрация машинного перевода с русского языка на английский, осуществленного на вычислительной машине ИБМ-701.), но важной сферой использования вычислительной техники стали намного позже.

Первые системы машинного перевода основывались на алгоритмах последовательного перевода: "слово за словом", "фраза за фразой". Перевод текста с одного языка на другой осуществлялся отдельными предложениями, при этом смысловые связи между ними никак не учитывались.

А. А. Ляпунов (выдающийся советский математик, один из основоположников кибернетики) с самого начала работ по машинному переводу говорил о переводе текста путем извлечения смысла текста – оригинала, и его представления на другом языке. К сожалению, эта проблема не решена и в настоящее время, несмотря на усилия Международной федерацией IFIP - мировым сообществом ученых в области обработки информации.

Много трудностей возникает при попытке формализации и построении алгоритма для работы с текстами, при работе над созданием специальных словарей, которые нужно вводить в машину, также неясным остаётся вопрос использования тех или иных лингвистических закономерностей при машинном переводе.

Таким образом, пока смысловой разбор предложения пока не реализован, и даже нет каких либо значительных достижений, по созданию машинных переводчиков этого типа, в мире создано большое множество других автоматизированных программ для перевода текстов. Все эти переводчики основаны на одном из двух принципов машинного перевода. Одни работают по принципу статистического машинного перевода (Statistical machine translation , SMT), а другие по принципу лексического анализа текста. Также существуют переводчики, которые объединяют оба этих принципа – гибридные или смешанные системы перевода.

Далее мы рассмотрим два вида машинного перевода: статистического и лингвистического принципов работы, а пока вкратце опишем принцип их работы.

Статистический машинный перевод — это разновидность машинного перевода текста, основанная на сравнении больших объемов языковых пар. Языковые пары — тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком — носителем двух языков, так и набором предложений и их переводов, выполненных человеком. Этот переводческий подход основан на вероятностном законе. Он использует модели статистического перевода. Один из применяемых подходов – теорема Байеса, т.е. P(E|F) = P(F|E) P(E), где P(F|E) – вероятность того, что исходная строка является переводом целевой строки, а P(E) – вероятность возможности получить строку целевого языка. Построение моделей статистического перевода – процесс довольно быстрый, но эта технология в большой степени зависит от наличия многоязычного корпуса текстов. Требуется минимум 2 миллиона слов для каждой отдельной области, если речь идет о языке в целом. Статистический машинный перевод требует наличия специального оборудования, для того чтобы «усреднять» переводческие модели. Примером статистического машинного перевода служит Google Translate.

Преимущества SMT -систем:

  1. Гладкость перевода;

  2. Легкость в построении при достаточном количестве параллельных корпусов;

  3. Переносимость технологии на любые языковые пары.

Недостатки SMT –систем:

  1. Ограниченность параллельных корпусов в природе;

  2. Неумение справляться с морфологией и синтаксисом;

  3. Искажение информации (дублирование, пропуск, подмена информации).

Машинный перевод, основанный на правилах (Rule - based Machine Translation, RBMT). Эта технология основана на словарной информации и анализе грамматических правил конкретных языков. Такие системы строятся на основе лингвистического описания двух естественных языков (двуязычных словарей и других баз данных, содержащих морфологическую, грамматическую и семантическую информацию), формальных грамматик и собственно алгоритмов перевода. Качество перевода зависит от объемов лингвистических баз данных (словарей) и глубины описания естественных языков, т. е., необходим учет максимального количества особенностей грамматической структуры как входного, так и выходного языка.

Преимущества RBMT -систем:

  1. Синтаксическая и морфологическая точность;

  2. Стабильность и предсказуемость результата,

  3. Возможность настройки на предметную область.

Недостатки RBMT -систем:

  1. Трудоемкость и длительность разработки;

  2. Необходимость поддерживать и актуализировать лингвистические базы данных.

Рассмотрим конкретный перевод одного текста с помощью программ перевода, основанных на этих двух принципах. Статистический машинный перевод – онлайн сервис Google Translate; лексический перевод – переводчик Promt.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]