Наука о переводе (англ. translation studies; нем. Ubersetzungswissenschaft или Translationswissenschaft) включает несколько направлений, среди которых выделяются теория перевода, анализ перевода, методика обучения переводу. Особое место занимает машинный перевод и автоматизированный — научная и одновременно технологическая дисциплина, связанная и с наукой о переводе и с компьютерной лингвистикой.
Машинный перевод
История машинного перевода
40-е: первые шаги
1.4.1. Машинный перевод: элементы хронологии. Начало работ по машинному переводу (МП) или автоматическому переводу (АП) относят к 50-м гг. XX в. Идея машинного перевода обязана своим происхождением чисто практическим нуждам. В начале 50-х гг. происходит информационный взрыв — существенно возрастают объемы научно-технической информации. Перевод всей научной и технологической периодики оказывается невозможным. Дополнительный импульс исследованиям в области МП дала «холодная война»: противостоящие общественно-политические системы внимательно следили за развитием научно-технического потенциала друг друга. Именно по этой причине многие первые зарубежные системы МП работают с русским языком.
Формальная дата начала эры машинного перевода — 1949 г. В этом году известный американский специалист по дешифровке Уоррен Уивер составил меморандум, в котором теоретически обосновал принципиальную возможность создания систем МП. Он исходил из того, что структурное сходство между языками может быть формально описано, а это является необходимым условием разработки алгоритмов для ЭВМ.
Меморандум был разослан двумстам специалистам в области лингвистики, дешифровки и теории программирования. С этого времени в США появляются коллективы разработчиков МП (в Массачусетском технологическом институте — MIT, в Калифорнийском университете, в Национальном бюро стандартов в Лос-Анджелесе, в Техасском университете). Первая международная конференция по МП организуется в 1952 г. в MIT. Наконец, в 1954 г. проводится известный Джорджтаунский эксперимент, в процессе которого осуществляется перевод с русского языка на английский. Хотя программа работала со словарем всего лишь в 250 слов, успех этого эксперимента стимулировал дальнейшие исследования в области МП.
В марте 1947 г. Уоррен Уивер (Warren Weaver), директор отделения естественных наук Рокфеллеровского фонда (Rockefeller Foundation), в переписке с Эдрю Бутом (Andrew D. Booth) и Норбертом Винером (Norbert Wiener) впервые сформулировал концепцию машинного перевода, которую несколько позже (в 1949 г.) развил в своем меморандуме, адресованном Фонду.
У.Уивер писал: "I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text.''
("У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно — это взломать код чтобы извлечь информацию, заключенную в тексте."). Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны.
Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г. в Джорджтаунском университете (г. Вашингтон, США).
В качестве пионеров машинного перевода в России выступили такие ученые как Панов Д.Ю., Ляпунов А.А., Мухин И.С., Бельская И.К [76, 77]. За ними последовали. Кулагина О.С., Мельчук И.А., Моторин Ю.А.,. Марчук Ю.Н.,. Пиотровский Р.Г. и многие другие.
В СССР первый эксперимент по МП прошел в 1955 г.: был осуществлен перевод на русский язык текстов по прикладной математике. К этому времени относится начало работ по МП в Институте прикладной математики АН СССР под руководством О. С. Кулагиной и И. А. Мельчука. Коллектив разработчиков создал три экспериментальные системы МП — с французского языка на русский (ФР-1), с английского на русский и с французского на русский (в новом варианте) [Кулагина 1979]. В 1959 г. открывается Лаборатория машинного перевода в МГПИ-ИЯ им. М. Тореза (ныне Московский государственный лингвистический университет), в которой возникли идеи, во многом предвосхитившие дальнейшее развитие теории МП и в какой-то степени систем искусственного интеллекта — концепция языка-посредника, понятие модели управления слова, роль словаря в МП и т. д. Серия публикаций этой лаборатории под общим названием «МП и ПЛ» (Машинный перевод и прикладная лингвистика), оказала существенное влияние не только на прикладную, но и на теоретическую лингвистику.
Изначально предполагалось, что системы МП не должны быть ограничены проблемной сферой. Иными словами, машинный перевод должен осуществляться на текстах любых типов — от научно-технических до художественных. Однако довольно быстро обнаружилось, что это невозможно. Выявились две группы причин — лингвистические и экстралингвистические.
1. Лингвистические — сводились к тому, что для разработки систем МП недостаточно имеющихся знаний о функционировании языковой системы. Нужны фундаментальные теоретические разработки в области изучения языка, поскольку традиционной лингвистике (за очень небольшими исключениями) была чужда сама постановка задачи машинного перевода, предполагавшая создание компьютерных моделей анализа и синтеза высказываний. Кроме того, многообразие функций языка, преимущественно имплицитный характер языковой способности человека существенно затрудняли формализацию знаний о языковой системе.
2. К экстралингвистическим причинам можно отнести осознание того факта, что процесс понимания — важнейшая составляющая естественного перевода — далеко не обеспечивается чисто лингвистическим анализом речевого сообщения. Понимание основывается на знаниях адресата, его способности делать выводы и умозаключения, кроме того оно связано с коммуникативной установкой адресата в данной ситуации общения и т. д.
1. ЭТАП на первом этапе делалась ставка прежде всего на грамматически правильный пословный перевод, а полисемия слов разрешалась в основном процедурными средствами на основе учета их синтаксических и семантических признаков. Поэтому системы МП первых трех десятилетий их развития можно охарактеризовать как системы семантико-синтаксического преимущественно пословного перевода. Словосочетания здесь также использовались, но в меньшей степени.
Первые системы МП характеризуются стратегией «прямого перевода». Сущность этого подхода к построению МП заключается в том, что исходный текст на языке L1 (= «входной язык») постепенно через ряд этапов преобразуется в текст языка L2 (= «выходной язык»). Преобразования сводятся к тому, что слово (словосочетание) на входном языке заменяется на его словарный эквивалент на выходном языке.
Семантико-синтаксический преимущественно пословный машинный перевод текстов не имеет перспективы, так как в естественных языках смысл словосочетаний, как правило, не сводим или не полностью сводим к смыслу составляющих их слов, и при переводе он не может быть "вычислен" на основе синтаксических и семантических признаков этих слов.
