- •Информационная теория перевода
- •Ситуативная теория перевода
- •22 Наука о переводе
- •Теория уровней эквивалентности
- •Теория военного перевода
- •Теория машинного перевода
- •Коммуникативно-функциональная теория перевода
- •Психолингвистическая теория перевода
- •Трансформационная теория перевода
- •Семантико-семиотическая модель перевода
- •Функционально-прагматическая (динамическая) модель перевода
- •Герменевтическая модель перевода
- •Трансформационная модель перевода
- •Механизм социальной регуляции переводческой деятельности
- •2. Машинный перевод
- •В ретроспективе и перспективе
- •23 Наука о переводе
23 Наука о переводе
только узкоспециальных математических текстов из книг, но и других текстов, для чего словарь нужно было расширить. Такая экспериментальная система МП была уже значительным шагом вперед по сравнению с опытом Дорстерта.
После первых удачных экспериментов группа сделала смелую попытку получить перевод газетного текста, используя тот же алгоритм. Этот опыт тоже увенчался успехом и был, как вспоминает профессор Д.Ю. Панов, неожиданностью даже для самих авторов.
Успех алгоритма лингвистического анализа заключался в таланте его создателя, в гениальном решении (даже открытии) основоположника советской инженерной лингвистики И.К. Вельской. На основе внимательного изучения своего алгоритма, составленного для математического текста, она пришла к убеждению, что успешный результат эксперимента не случаен, а закономерен, что алгоритм, созданный на основе специфических текстов, относящихся к области научной литературы, и притом математической, имеет в себе все элементы, которые должны присутствовать в алгоритме лингвистического анализа любого текста.
Вскоре после первого англо-русского МП в Математическом институте им. В.А. Стеклова АН СССР на ЭВМ «Стрела» под руководством О.С. Кулагиной был сделан еще один опытный МП научного текста с французского языка на русский.
В 1956 г. в Москве было создано Объединение по машинному переводу, которое начало выпускать «Бюллетень Объединения по проблемам машинного перевода». Вышло 7 номеров. В 1959 г. сборник получил название «Машинный перевод и прикладная лингвистика».
В 1956 г. в Москве была организована Лаборатория машинного перевода. Руководил лабораторией математик и лингвист — переводчик Ю.А. Моторин. В группе Моторина работали В.А. Павлов, Ю.Н. Марчук, Д.А. Жуков, Е. Николаев, А. Богомолкин, Е. Княгинин, В.И. Щербинин и многие другие.
В 1958 г. в группу пришла языковед-русист Е.Ф. Калинина, которая разработала русскую часть машинного словаря. Она предложила построить машинный словарь как словарь нескольких основ слов (у И.К. Вельской существительные в словаре давались в именительном падеже). Е.Ф. Калинина определила 10 типов формообразования для всех грамматических классов слов, выделила 77 лексических групп русских слов, составила словарь сочетаемости, семантические таблицы и т.д.
К середине 1957 г. группа Моторина переработала на ЭВМ массив общественно-политических текстов газетной тематики протяженностью почти в 5 млн словоупотреблений. На основе полученных частотных словарей в машинный словарь были отобраны 22 тыс. английских слов и около 40 тыс. русских слов и выражений. В словарь вошли все слова с частотой (встречаемостью) более двух раз во всем массиве обработанных текстов (F > 2) и некоторые слова с частотой, равной двум (F = 2). Такой словарь по законам лингвостатисти- ки покрывал 98,5% любого английского текста газетной тематики, т.е. практически машина переводила 99 слов из 100.
Частотные словари формировались по длине слов (одно- буквенные, двубуквенные и т.д.), а внутри каждого массива равнодлинных слов — по алфавиту. Были составлены словари омографов (3200 слов); обратные частотные словари, в которых слова были ранжированы по окончаниям; алфавитные словари сочетаемости (существительных, глаголов, прилагательных, наречий, предлогов, союзов, артиклей) с правыми и левыми расширениями; словари устойчивых словосочетаний и оборотов; таблицы неправильных английских глаголов; таблицы всех форм вспомогательных глаголов, таблицы исправления искажений (орфографических ошибок) на входе и выходе; программа многозначных слов; алгоритм синтаксического анализа и т.д. В словарь вошли все знаки препинания, которые считались словами.
В 1959 г. система МП группы Моторина «сдала экзамен» и показала что она может переводить на русский язык любой текст общественно-политической тематики из английских и американских газет и некоторые научно-технические тексты. Переведенный текст формировался на выходе и выдавался на печать как машинописный лист стандартного формата с соответствующей рубрикацией.
Созданный алгоритм МП, хотя и нуждался в доводке, был пригоден для работы на ЭВМ любых систем (с использованием транслятора), что снимало проблему создания специализированных переводческих машин — машин-перевод- чиков.
Это был первый «промышленный», экономически выгодный алгоритм машинного перевода, созданный сотрудниками лаборатории машинного перевода под руководством Ю.А. Мо- торина. Успех лаборатории объясняется, с одной стороны, целенаправленностью, упорством и самоотверженными усилиями ученых, поставивших перед собой задачу создать рабочий алгоритм перевода с английского языка на русский, а с другой — большими силами и средствами, выделенными для выполнения задачи, современным для того времени техническим оснащением лаборатории.
Летом 1958 г. в Москве была проведена I Всесоюзная конференция по машинному переводу, в которой приняли участие ученые Москвы, Ленинграда, Киева, Еревана, Тбилиси, Горького и других городов.
В своем выступлении на конференции И.К. Вельская утверждала (в отличие от многих зарубежных ученых, считавших возможности формализации ограниченными), что формализации поддается и семантическая сторона языка, не говоря уже о фонетической, лексической, грамматической, но полная формализация возможна «...только на основе анализа, проводимого на реальных языковых фактах, на скрупулезном изучении реальной ситуации, имеющей место в современном английском языке... привлекая колоссальное количество материала из многих научных и технических книг и журнальных статей... в случае необходимости и произведения художественной литературы, если они дают возможность обнаружить искомые закономерности в более ясной и отчетливой форме, и иногда даже такие книги, в которых сохранены своеобразные фольклорные обороты речи, интересные для некоторых случаев анализа», т.е. на действительном строе языка и наблюдаемых в нем закономерностях, а не на спекулятивных рассуждениях «бумажного» алгоритмизирования.
В 1959 г. на конференции ЮНЕСКО И.К. Вельская, отчетливо формулируя в своем докладе идею о возможности лингвистической формализации любого текста и пригодности ее алгоритма для лингвистического анализа любого текста, включая художественный, привела несколько примеров МП художественной литературы (Диккенса, Олдриджа, Голсуор- си, Эдгара По), ссылаясь на проверочные эксперименты МП. Вельская настаивала на типизации и унификации перевода. Ни до, ни после нее никто не смог осуществить на ЭВМ перевод художественного текста. Именно за это «неумение» сторонники и разработчики МП подвергались критике со стороны противников МП.
Всей своей дальнейшей исследовательской работой по МП, вплоть до кончины в 1964 г., И.К. Вельская доказывает, что алгоритм лингвистического анализа должен быть гибким, пригодным для работы с таким постоянно меняющимся объектом, как язык; с самого начала алгоритм надо строить так, чтобы он был адаптивным, самонастраивающимся, чтобы в случае необходимости его легко можно было расширять и дополнять; символика, используемая для построения алгоритма, должна быть простой и прозрачной. Эта гибкость, способность к совершенствованию и простота построения являются важнейшими достоинствами разработанного И.К. Вельской алгоритма автоматического лингвистического анализа.
В те годы активные исследования в области МП проводились в США, Англии, Мексике, Японии, Китае, Израиле и других странах. Однако ведущей страной по созданию систем МП по всеобщему признанию стал Советский Союз.
В СССР работы в области МП велись во многих научных организациях и учебных заведениях в Москве, Ленинграде, Киеве, Тбилиси, Ереване, Новосибирске, Горьком, Саратове, Ташкенте и других городах. В Москве над этими проблемами работали во Всесоюзном институте научной и технической информации (ВИНИТИ), Центральном научно-иссле- довательском институте патентной информации (ЦНИИ- ПИ), Математическом институте им. В.А. Стеклова и других организациях.
В разработке некоторых вопросов машинного перевода «машинных» результатов добились советские ученые О.С. Кулагина, Е.В. Падучева, Т.М. Николаева (которая ставила опыт вместе с И.К. Вельской), Н.Д. Андреев и др.
Многими исследователями была выдвинута идея языка- посредника. Язык-посредник, или вспомогательный язык, — это система записи, пригодная для однозначного и достаточно удобного представления смысла текста, подлежащего МП. В качестве языка-посредника лингвисты предлагали либо английский язык, либо язык типа эсперанто, либо какой-нибудь искусственный язык и т.д.
Наиболее интересной была концепция профессора Н.Д. Андреева, в то время руководителя лаборатории МП в Ленинградском университете. Н.Д. Андреев предложил создать язык-посредник на основе грамматики и словарей различных языков, включив в словарь грамматические правила и лексические единицы, универсальные для большинства языков мира, и выразить его в машинопонятных символах. Однако системы с языками-посредниками не дали ощутимых результатов. Тем не менее идея языка-посредника по-прежнему существует: недавно в качестве языка-посредника американский специалист по искусственному интеллекту Р. Бриггс предложил санскрит.
В период 50-х и особенно в 60-е гг. XX в. многие лингвисты увлекались бесплодным теоретизированием, создавали так называемые «бумажные» алгоритмы «будущего», которые не могли быть (и не могут быть) реализованы на ЭВМ, что, естественно, тормозило дальнейшее развитие систем МП. В этот период недостатками, тормозившими работы многих исследовательских коллективов в области МП, были их разобщенность, слабая техническая оснащенность и материальная обеспеченность, а иногда и просто отсутствие какой-либо материально-технической базы; недостатки можно объяснить и причинами иного порядка, в том числе незаинтересованностью министерств и ведомств в результатах работ по МП, его внедрении, считавших, что поступающий из- за рубежа объем научно-технической информации под силу существующей когорте переводчиков, и, естественно, тем, что энтузиазм исследователей падал из-за отсутствия скорых реальных результатов.
Отрицательное влияние на мнение научной общественности оказала и статья известного структуралиста И. Бар-Хил- лела «Будущее машинного перевода (почему машины не могут научиться переводить)», опубликованная у нас в 1969 г. почти одновременно в журналах «Вопросы языкознания» и «Филологические науки», в которой этот авторитетный ученый, исходя из литературоведческой концепции и теории художественного перевода, сомневался в успешной результативности работ по МП в ближайшие 20—30 лет.
Наметившийся в начале 60-х гг. спад в изыскательской деятельности отдельных коллективов еще больше усилился, энтузиазм резко пошел на убыль, ряды некоторых групп сильно поредели — распались или были ликвидированы, включая и отделения прикладной лингвистики ведущих учебных заведений страны.
Мы не будем здесь далее подробно останавливаться на истории вопроса. Отметим только, что, несмотря на известный спад в 60-х гг. и скептические высказывания как в Советском Союзе, так и за рубежом, машинный перевод осуществлялся и работы в этом направлении продолжались в США, Японии, СССР и других странах. Исследовательская деятельность была сконцентрирована в основном в университетах и немногих специализированных организациях: Гренобль (Франция), Саарбрюккен (ФРГ), Монреаль (Канада), Техас (США), Киото (Япония), проект Евротра (Европейское экономическое сообщество), Москва, Ленинград (СССР).
В последние годы расширился перечень типов разрабатываемых систем для автоматизации перевода. Если на начальном этапе развития МП, т.е. примерно до середины 60-х гг., основное внимание уделялось только созданию «пакетных» систем, рассчитанных либо на полностью автоматический режим работы, либо на полуавтоматический режим с использованием человека на этапах пред- и постредактированиях, то затем в середине 60-х — начале 70-х гг. появились крупные автоматические многоязычные словари и терминологические банки. В настоящее время все больше внимания уделяется созданию интерактивных систем МП, разнообразных автоматических словарей и автоматизированных рабочих мест (АРМ) переводчика.
Весьма обширные изыскания в области МП продолжались (да и не прекращались во время «спада») в США. Интенсивная работа велась, например, в исследовательском центре ВВС
США «РОМ», где опыты проводились с июня 1959 г., а с начала 1963 г. началась эксплуатация созданной фирмой системы русско-английского МП, работающей со скоростью 35 слов в минуту.
Как показывают материалы I Международного совещания по проблемам коммуникации «человек — ЭВМ», состоявшегося 9—12 сентября 1980 г. в Варшаве, в США проводились исследования по проблемам коммуникации «человек — ЭВМ» в университете Карнеги-Меллон, Стэнфордском, Йель- ском, Гарвардском университетах и Массачусетсском технологическом институте. Аналогичные работы велись в ФРГ в Хайдельбергском университете, в Институте информатики в Штутгарте и Институте связи в Веселинге. По данным 60-х гг., в распоряжении ЦРУ США имелась ЭВМ, выполняющая переводы текстов средней трудности с русского языка на английский со скоростью 30 тыс. слов в час. В 1970 г. на базе ВВС США в Райт-Петерсоне начала работать система русско-английского МП СИСТР АН, переводящая за час машинного времени 300 тыс. слов текста. С 1974 г. эта система используется Национальным управлением по аэронавтике и исследованию космического пространства (НАСА). В Канаде с 1975 г. действует система МЕТЕО, которая переводит метеорологические сводки с английского языка на французский.
Известно, что в США еще в начале 70-х годов машины успевали переводить с русского языка на английский до 700 млн слов в год, что, правда, составляет 7% поступавших советских публикаций, а отдел иностранной техники ВВС США осуществлял перевод текстов с русского языка на английский общим объемом порядка 100 тыс. слов в день. Всего же в США поступало и перерабатывалось колоссальное количество информации на иностранных языках. По статистике Союзпечати, посольство США в Москве выписывало советских газет и журналов более 900 наименований и газет и журналов социалистических стран свыше 130 наименований. Только в течение суток так называемая «мониторная служба» ЦРУ принимала и записывала около 6 млн слов на 60 языках.
Решение проблемы оперативной переработки большого количества информации, естественно, связано с использованием передовой техники, созданием таких электронных автоматизированных систем, которые способны анализировать, накапливать и по первому требованию выдавать необходимые сведения.
В настоящее время главная цель состоит не в том, чтобы немедленно получить полностью МП высокого качества, о каком говорили в 50-х гг., а в том, чтобы создать систему, которая сразу обеспечивала бы приемлемое качество перевода и позволила бы производить дальнейшее совершенствование системы уже после ввода ее в промышленную эксплуатацию.
Среди советских коллективов, работавших в области МП, следует отметить Всесоюзный центр переводов научно-тех- нической литературы и документации Государственного комитета СССР по науке и технике Академии наук СССР (ВЦП), который являлся головной организацией по научно- техническому переводу и по машинному переводу. Объем научно-технических переводов, выполняемых ВЦП, постоянно рос. Так, если в 1974 г. ВЦП выполнил перевод 20 тыс. а.л., то в 1988 г. — свыше 80 тыс. а.л. ВЦП выполнял переводы по заказам государственных учреждений всех министерств и ведомств. Специфика и разнообразие задач, стоявших перед этими организациями, определяли состав языков и тематику переводов. Переводы ВЦП составляли примерно 70% всего годового поступления в государственный фонд научно-техни- ческих переводов.
В 1985 г. ВЦП выполнил переводы с 35 иностранных языков на русский и с русского языка на 31 иностранный. Объем переводов, выполняемых с того или иного иностранного языка, отражает место этого языка в мировой системе научно-технической информации. Так, на долю 10 ведущих языков приходилось примерно 95% всего объема переводов, а на долю остальных 25 языков — только 5%. Среди десяти основных языков выделяются: английский (62,5%), немецкий (15,4%), японский (6,4%) и французский (5,8%).
С 1979 г. в ВЦП функционировали первые в стране промышленные системы МП с английского, немецкого и французского языков на русский — АМПАР, НЕРПА, ФОРТРАН. Была создана система англо-немецко-русского автоматизированного перевода АНРАП-А. Оперативно выполнялись с постредактированием и рассылались заказчикам переводы по вычислительной технике, программированию, машиностроению, использованию атомной энергии и другим тематикам. Велась разработка системы МП с немецкого (НЕРПА), французского (ФОРТРАН) и японского (ЯРАП) языков, был создан многоязычный автоматический словарь, велись работы над АПС и АРМ переводчика и редактора, была создана информационная инфраструктура системы терминологического обеспечения ВЦП.
Среди советских коллективов, успешно работавших в области МП, можно назвать общесоюзную группу «Статистика речи», руководимую профессором Р.Г. Пиотровским, создавшую опытно-промышленные системы автоматизированного лингвистического обслуживания МП.
Чимкентский коллектив этой группы, под руководством профессора К.Б. Бектаева осуществлял промышленный по- словно-пооборотный МП статей и патентов по химии полимеров с английского языка на русский с постредактированием. По отзывам специалистов-заказчиков, качество перевода вполне удовлетворительное.
Стоимость МП на первых этапах работы опытно-промышленной системы переработки информации приблизительно равнялась стоимости обычного «ручного» перевода (РП). Параллельно с осуществлением опытно-промышленно- го МП чимкентским коллективом велась большая научно-ис- следовательская работа, направленная на улучшение качества МП и на разработку систем, позволяющих получить перевод более высокого уровня. В результате такой адаптации опытной системы к промышленному режиму соотношение стоимости между МП и РП изменилось в пользу машинного перевода.
В лаборатории лингвистики в ЛГПИ им. А.И. Герцена и в ВЦП совместно с Институтом востоковедения АН СССР осуществлял японско-русский экспериментальный перевод. Минский ГПИИЯ совместно с Львовским НИИ бытовой химии вел работу по созданию карманного компьютера-пере- водчика. В Киеве в НИИ была создана и сдана в эксплуатацию система МП заголовков и патентов, в Ужгородском госуниверситете создана система АРМ. Исследования и разработки в области МП велись в Институте прикладной математики, Институте языкознания АН СССР, Институте русского языка АН СССР, Военном институте иностранных языков, в академических науках Армянской, Грузинской, Казахской ССР, ВИНИТИ АН СССР и других коллективах.
В международном семинаре «ЭВМ и перевод-89», который состоялся в ноябре-декабре 1989 г. в Тбилиси, выразили желание принять участие более 200 ученых и специалистов из Австрии, Западного Берлина, Болгарии, Голландии, Великобритании, Венгрии, ГДР, Египта, Индии, Испании, Италии, Канады, Польши, СССР, ФРГ, Финляндии, Франции, Чехословакии, Югославии, Японии.
Анализ состава участников и проблематики докладов данного семинара и трех предшествовавших семинаров, состоявшихся в Москве в 1975, 1979, 1983 гг., показывает, что за 14 лет МП вырос из достаточно узкой сферы научных исследований в самостоятельное направление в информационной индустрии. Проблематика МП охватывала не только лингвистические проблемы, но и проблемы программирования, определения оптимальных конфигураций отдельных ЭВМ и локальных сетей ЭВМ для МП, проблемы взаимозависимости и взаимоотношений разработчиков и пользователей различных средств автоматизации перевода в процессе их создания и эксплуатации.
Медленно, но верно машинный перевод из отдаленной перспективы становился информационной реальностью.
В настоящее время, по данным А. Шмелевой, можно назвать следующие коммерческие системы машинного перевода, доступные российскому пользователю:
PARS 3.00, предлагаемая харьковской фирмой «Лингвистика 93» и выполняющая перевод с русского языка на английский и наоборот. Система имеет такие версии, работающие с украинским и немецким языками.
SILOD, разработанная специалистами отдела прикладной лингвистики Российского государственного университета в Санкт-Петербурге.
MULTIS, предлагаемая АО «ЭЛЬКО», способная автоматически определять язык документов и имеющая англо-рус- скую, французско-русскую, португальско-русскую, испанско-русскую, итальянско-русскую и русско-английскую версии.
GTS GLOBAL LINK — американский электронный переводчик.
STILOS, существующая на рынке уже более 10 лет и ставшая (отчасти благодаря удачной рекламной компании) его признанным несомненным лидером. Первые версии этой программы были известны под названием «пром МТ». Сегодня санкт-петербургская фирма «пром МТ» предлагает семейство программ-переводчиков с английского, немецкого, французского, итальянского и испанского языков, а также с русского языка на английский и немецкий.
Как справедливо отмечает Ю.Н. Марчук, «современные системы МП, дающие все еще не очень качественный перевод, но при удобном для пользователя программном обеспечении и при настройке на типы переводных текстов, все более совершенные при улучшающихся возможностей компьютеров, будут и далее совершенствоваться на теоретической основе переводных соответствий. Как свидетельствует опыт развития зарубежных и отечественных промышленных и коммерческих систем МП, несмотря на заметный прогресс в их развитии и значительную распространенность, они по-прежнему не могут перейти 80%-ный порог понятности перевода на реальных научно-технических текстах. Тем самым мечта о полностью автоматизированном высококачественном МП, как и 30 лет тому назад, пока остается недостижимой».
Говоря о ПСМ и МП, следует отметить, что и тот и другой перевод, в зависимости от используемых технических средств, может быть механизированным, автоматизированным и автоматическим. Действительно, механизированная система предусматривает наличие каких-либо технических средств, расширяющих возможности переработки информации. Автоматизированная система предполагает обработку информации на основе четко нормированных действий с применением ЭВМ и другой техники, обеспечивающей минимальное использование возможностей человека и машины. Под термином «автоматический» обычно понимают какой- либо процесс или действие, совершающееся без участия человека. В этом плане существующие методики машинного перевода — лексического, грамматического, семантического — являются этапами его автоматизации. Реализация всех существующих методик в единой системе позволяет осуществить лишь автоматизированную и/или полуавтоматическую переработку информации в условиях двуязычной ситуации. Полностью автоматической система обычно мыслится только при условии осуществления аудиовизуального ввода и вывода адекватно конфронтируемой информации с первоисточника без участия человека. Поэтому термин «автоматический перевод» в своем полном и прямом значении характеризует наивысший и пока еще не достигнутый этап использования машины в системах перевода. Так как на данном этапе науч- но-технического прогресса во всех звеньях процесса управления и переработки информации участвует человек, какое бы количество техники ни привлекалось ему в помощь, управление системами с применением ЭВМ и других технических средств пока является не автоматическим, а автоматизированным управлением, тогда как сами системы, включая системы переработки информации, — автоматизированными и/или полуавтоматическими.
Когда речь идет о МП и ПСМ, то оба вида перевода называют либо автоматическим переводом, либо автоматизированным. Однако здесь следует различать МП и ПСМ как систему перевода и как процесс перевода, а именно:
в зависимости от уровня взаимодействия человека и машины в системах «человек — машина — человек». Системы МП, в которых в настоящее время ЭВМ обеспечивает минимальное использование возможностей человека (пред- и постредакторские правки и пр.), являются автоматизированными системами. Системы ПСМ, в которых компьютер выступает в качестве помощника, консультанта переводчика, т.е. является тем техническим средством, которое лишь расширяет возможности переработки информации человеком, являются системами механизированными;
в зависимости от степени использования компьютера в самом процессе перевода. Процесс машинного перевода выполняется практически без участия человека, ибо пред- и постредакторские правки не прерывают сам процесс перевода, и, следовательно, процесс МП является автоматическим. В процессе ПСМ компьютер выступает в качестве вспомогательного средства (как помощник, консультант человека), причем пред- и постредакторские правки интегрально входят в сам процесс перевода, и, следовательно, процесс ПСМ является автоматизированным.
В настоящее время существует ряд коммерческих систем ПСМ, включающих различные машинные словари, которые несомненно имеют определенные преимущества для пользователя-переводчика (т.е. самого исполнителя перевода). Однако «спор» между системами МП и ПСМ, на наш взгляд, должен решиться в пользу и тех и других (в зависимости от потребностей заказчика и исполнителя-пользователя).
Что касается художественного перевода, то пальма первенства здесь несомненно, принадлежит и будет принадлежать ПСМ как помощнику и консультанту переводчика. А в специальных жанрах перевода процесс перевода, в зависимости от предъявляемых заказчиком-потребителем объемов перевода, распадается на собственно МП и ПСМ.