Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Форм решения в МП.doc
Скачиваний:
8
Добавлен:
20.07.2019
Размер:
170.5 Кб
Скачать

Проблемы машинного перевода

Что же происходит при машинном переводе и почему проблема столь сложна? По современным представлениям процесс машинного перевода текстов с одного естественного языка на другой может быть разделен на три этапа:

первый этап: семантико-синтаксический анализ текста на входном языке (выявление его грамматической структуры, распознавание наименований понятий и отношений между понятиями);

второй этап: трансфер (переход от наименований понятий и структуры текста на входном языке к наименованиям понятий и структуре текста на выходном языке);

третий этап: семантико-синтаксический синтез текста на выходном языке (его грамматическое оформление). В различных системах машинного перевода эти этапы не всегда бывают четко выделены, но, тем не менее, они всегда присутствуют.

На первом этапе предложение расчленяется на части речи, в нем выделяются стандартные конструкции, на втором этапе слова и словосочетания переводятся по находящимся в памяти машины словарям, и, наконец, на третьем этапе переведенные части речи собираются по правилам другого языка. Теоретически - все просто, но на практике получить полноценный перевод довольно трудно. В зависимости от того или иного стиля и назначения текста одно и то же слово нередко имеет разные значения. В какой-то мере эта особенность учитывается в современных системах МП: предусмотрены сменные словари, иногда для каждого вида текста используется свой словарь. Если лексики одного машинного словаря не хватает, и применяются несколько словарей одновременно, то системе можно указать, из какого словаря нужно выбирать слово, если есть несколько вариантов его перевода. Наконец, программа сама может предложить пользователю несколько вариантов перевода, и он выберет подходящий вариант, так сказать, вручную. Могут возникнуть проблемы с переводом слов в устойчивых словосочетаниях и фразеологизмах, но современному компьютеру вполне по силам решить их.

Кроме известных морфологических и синтаксических правил в каждом языке существуют свои неписаные особенности, которые иногда весьма трудно предусмотреть при машинном переводе. Например, предложение на английском языке "This is my sister" дословно переводится "Это есть моя сестра", и формально этот перевод будет правильным, но по-русски так не говорят. В данном случае можно сказать, что предложение "выглядит так, будто его написал иностранец". Конечно, возможность исключения "is" довольно просто решается в программе машинного перевода, но, тем не менее, это остается одной из самых распространенных ошибок при МП. Необходимо учитывать и тот факт, что в тексте могут встречаться слова, которые нужно понимать в контексте образа жизни людей в конкретной стране - под словом "демократ" в США подразумеваются политики, выступающие за большее вмешательство государства в экономику, а в России - это те, кто выступает за большую свободу рынка.

Для качественного перевода очень важно, чтобы практически все слова исходного текста легко было найти в словаре системы. А те из них, которых в нем нет, обычно переносятся в текст непереведенными уже на выходе из системы, и их впоследствии переводят вручную при редактировании результатов перевода. Такие слова могут повлиять на качество перевода предложения. Дело в том, что для определения, к какой части речи относится рассматриваемое слово, система производит анализ всего предложения в целом. При этом имитируется мыслительная деятельность человека (такую систему принято называть системой с элементами искусственного интеллекта). Если значение хотя бы одного слова в предложении не определено, то это может исказить результаты анализа всего предложения, а иногда и результаты перевода.

Так для чего же сегодня можно использовать MП? Для перевода больших массивов однородных текстов с небольшим узкоспециализированным словарным запасом и примитивной грамматикой. Больших - потому что настройка программы на текст определенного типа занимает много времени, и оправдывает себя, только если необходимо перевести достаточно объемный текст. Однородных и с небольшим словарным запасом - потому что для каждого переводимого текста следует сразу же решить вопрос омонимов для всех входящих в текст слов. С примитивной грамматикой - потому что со сложными конструкциями современные программы не справляются.

Всплеск интереса к системам машинного перевода наблюдается в настоящее время в связи с развитием сети Интернет. Миллионы людей, говорящих на разных языках, оказались в едином информационном пространстве, в котором доминирует английский язык. Но есть пользователи, которые им не владеют, как, впрочем, есть множество Web-страниц, написанных не по-английски. Для облегчения просмотра страниц Интернета, написанных на незнакомом пользователю языке, появились дополнения к браузерам, которые осуществляют немедленный перевод выбранных пользователем фрагментов просматриваемой Web-страницы. Достаточно лишь выделить часть текста мышкой и перенести ее на специальную панель, либо нажать указателем на специальную кнопку меню. Примером такого переводчика является система Web Trans Site фирмы ПРОМТ, созданная на базе программы МП ПРОМТ, которая работает как с браузером Netscape Navigator, так и с браузером Microsoft Internet Explorer. Дальнейший шаг - реализация перевода текстов непосредственно в сети Интернет. Несколько месяцев назад справочная служба AltaVista, осуществляющая поиск Web-страниц, стала бесплатно оказывать услуги по машинному переводу найденной страницы.

На современном рынке программного обеспечения существует много систем МП. В России к коммерческим системам МП относят, в первую очередь, ПРОМТ и СОКРАТ.