Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Prikladna / L_12

.docx
Скачиваний:
48
Добавлен:
12.02.2016
Размер:
28.63 Кб
Скачать

8

12. Машинний переклад

1. Машинний переклад: елементи хронології.

2. Машинний переклад: елементи періодизації стратегій.

3. Машинний переклад: елементи типології систем.

4. Основні ділянки використання машинного перекладу.

1. Машинний переклад: елементи хронології. Початок робіт із машинного перекладу (МП) чи автоматичного перекладу (АП) належить до 50-х рр. XX ст. Ідея машинного перекладу пов’язана з чисто практичними потребами. На початку 50-х рр. відбувається інформаційний вибух — суттєво зростають обсяги науково-технічної інформації. Переклад усієї наукової і технологічної періодики виявляється неможливим. Додатковий імпульс дослідженням в галузі МП дала «холодна війна»: протилежні суспільно-політичні системи уважно стежили за розвитком науково-технічного потенціалу одна одної.

Формальна дата початку ери машинного перекладу — 1949 р. У цьому році відомий американський спеціаліст із дешифрування Воррен Вівер склав меморандум, у якому теоретично обґрунтував принципову можливість створення систем МП. Він виходив з того, що структурна подібність між мовами може бути формально описана, а це є необхідною умовою розробки алгоритмів для ЭОМ. Меморандум було розіслано двомстам спеціалістам в галузі лінгвістики, дешифрування й теорії програмування. З того часу в США з’являються колективи розробників МП (у Массачусетському технологічному інституті — MIT, у Каліфорнійському університеті, у Національному бюро стандартів у Лос-Анджелесі, у Техаському університеті). Першу міжнародну конференція з МП організують у 1952 р. у MIT. У 1954 р. проводять відомий Джорджтаунський експеримент, у процесі якого перекладають з російської мови на англійську. Хоча програма працювала зі словником обсягом лише 250 слів, успіх цього експерименту стимулював подальші дослідження в галузі МП.

В СССР перший експеримент з МП відбувся в 1955 р: перекладено російською мовою тексти із прикладної математики. До того часу належить початок робіт з МП в Інституті прикладної математики АН СССР під керівництвом О. С. Кулагіної та І. А. Мельчука. Колектив розробників створив три експериментальні системи МП — з французької мови на російську (ФР-1), з англійської на російську і з французької на російську (у новому варіанті) [Кулагина 1979]. У 1959 р. відкривають Лабораторія машинного перекладу в МГПИИЯ ім. М. Тореза (сьогодні Московський державний лінгвістичний університет), у якому виникли ідеї, що вплинули на подальший розвиток теорії МП і певної мірою систем штучного інтелекту — концепція мови-посередника, поняття моделі керування слова, роль словника в МП тощо. Серія публікацій цієї лабораторії під назвою «МП і ПЛ» (Машинний переклад і прикладна лінгвістика), суттєво вплинула не тільки на прикладну, але й на теоретичну лінгвістику. Багато з цих ідей відобразилися на проекті системи англо-російського автоматичного перекладу (АРАП), яку, однак, не завершили.

Спочатку передбачали, що системи МП не мають бути обмежені проблемною сферою. Машинний переклад має здійснюватися на текстах будь-яких типів — від науково-технічних до художніх. Однак досить швидко з’ясували, що це неможливо. Виявили дві групи причин — лінгвальні та екстралінгвальні.

Лінгвальні — зводилися до того, що для розроблення систем МП недостатньо наявних знань про функціювання мовної системи. Необхідні фундаментальні теоретичні розробки в галузі вивчення мови, бо традиційна лінгвістика не ставила завдання машинного перекладу, яке передбачало створення комп’ютерних моделей аналізу і синтезу висловлювань. Окрім того, різноманітність функцій мови, переважно імпліцитний характер мовної здатності людини суттєво утруднювали формалізацію знань про мовну систему. До екстралінгвільних причин можна віднести усвідомлення того факту, що процес розуміння — важливий складник природного перекладу — не забезпечує чисто лінгвістичний аналіз мовленнєвого повідомлення. Розуміння засновується на знаннях адресата, його здатності робити висновки, окрім того розуміння пов’язане з комунікативною настановою адресата в певній ситуації спілкування тощо.

Розчарування, яке виникло, навіть формально зафіксували в 1966 р. у доповіді консультативного комітету з автоматичного опрацювання природних мов (ALPAC) при Національній академії наук США. У доповіді зверталася увага на те, що жодна із систем МП не виправдала надій ні щодо якості, ні щодо економічності. За наведеними там даними, «природний» переклад виявлявся суттєво дешевшим, ніж машинний. Доповідь призвела до згортання державного фінансування проектів створення систем МП у США, що прямо вплинуло на позицію державних структур стосовно підтримки розробок в галузі машинного перекладу у всьому світі. Однак незважаючи на скепсис щодо перспектив МП, багато з перших систем МП, створених у 60-ті рр., продовжували експлуатувати замовники. Більшість кінцевих користувачів мало цікавила якість перекладу (низька якість — один з важливих пунктів звинувачення у доповіді комітету ALPAC). Для споживача було важливіше швидко в загальних рисах оцінити інформаційний потік в науковій і технічній періодиці, а потім матеріал, який викликав інтерес, перекладали звичним способом — з участю перекладача. Окрім того, не припинили фінансування досліджень у сфері МП приватні компанії, зацікавлені не тільки у відстежуванні світових тенденцій науково-технічного прогресу, але й у перекладі величезних обсягів технічної документації, яка необхідна під час експорту та імпорту різної продукції, зокрема й високотехнологічної.

З середини сімдесятих років у всьому світі спостерігається стійке зростання інтересу до МП. У Москві в 1974 р. в інституті ИНФОРМ-ЭЛЕКТРО почали роботи зі створення системи франко-російського перекладу (ЭТАП-1) і системи англо-російського перекладу (ЭТАП-2). У цьому ж році створено Всесоюзний центр перекладів (ВЦП), у якому низка наукових колективів працює над системами машинного перекладу — АМПАР (англо-російський переклад), НЕРПА (німецько-російський переклад) і ФРАП (французько-російський переклад). З того часу промислові системи машинного перекладу розробляють і широко використовують у США, Європі та Японії.

2. Машинний переклад: елементи періодизації стратегій. Перші системи МП характеризувалися стратегією «прямого перекладу». Сутність цього підходу до побудови МП полягає в тому, що вихідний текст мовою L1 (= «вхідна мова») поступово через ряд етапів перетворюється на текст мови L2 (= «вихідна мова»). Перетворення зводяться до того, що слово (словосполука) вхідною мовою заміняють на його словниковий еквівалент вихідною мовою. У системах першого покоління, які використовують стратегію прямого перекладу, нема потреби моделювати функціювання мовної системи загалом. Для роботи таких систем виявляються цілком достатніми правила словникових відповідників. Лише інколи проводиться аналіз контексту для перекладу неоднослівних висловів, знову-таки представлених у словнику системи. Важливо зважати на те, що стратегія прямого перекладу не розрізняє розуміння (аналіз) і синтез (породження), бо вони фактично вилучені з перетворень за правилами словникових відповідників. Прямий переклад завжди прив’язаний до конкретної пари мов. Напр., неоднозначність висловів вхідної мови вирішується лише тією мірою, якою це виявляється необхідним для вихідної мови. Стратегію прямого перекладу у принципі не можна застосувати для проектування систем МП на більше, ніж одну мову. За часовими межами системи першого покоління здебільшого створювали в період з кінця 40-х до середини 60-х рр. Один з типових прикладів системи такого типу — програма GAT.

Суттєва модифікація стратегії «прямого перекладу» виявляється в системах з «трансфером» — етапом міжмовних операцій, які не можна звести до заміни вхідної мови на словникові відповідники вихідної мови. Наявність етапу трансферу передбачає побутову «проміжного» чи «внутрішнього» представлення, яке далі «пристосовується» до структури речення вихідної мови. На відміну від першої стратегії, в архітектурі систем МП із трансфером аналіз (розуміння) і синтез існують як особливі процедури й обслуговуються різними алгоритмами. У певному смислі системи із трансфером виявляються проміжною ланкою між стратегією прямого перекладу і подальшою стратегією мови-посередника (система TAUM).

Критика стратегії прямого перекладу привела до створення «стратегії перекладу через мову-посередник» чи «стратегії мови-посередника». Головна особливість цієї стратегії полягає у тому, що між структурами вхідної мови і структурами вихідної мови перебуває одна чи кілька проміжних мов, на які за відповідними правилами послідовно «переписуються» вислови мови L1. Доречно згадати відому тезу Романа Якобсона про те, що «Наука про мову не може інтерпретувати жодного лінгвального явища без перекладу його знаків на інші знаки тієї ж системи чи на знаки іншої системи» [Якобсон 1985 в, с. 363]. Аналіз і синтез під час використання мови-посередника принципово розділяються. Аналіз здійснюється в категоріях вхідної мови, а синтез — в категоріях вихідної. Як мова (мови)-посередники можуть виступати мови представлення синтаксичної і семантико-синтаксичної структури, чисто семантичні мови, мови глибинної семантики, які наближаються до концептуального представлення у категоріях теорії знань (фреймів, сценаріїв, планів). Системи машинного перекладу, засновані на знаннях (knowledge-based systems), які виникли 80-ті рр., розглядають як частину систем штучного інтелекту. Досить умовно ця стратегія відповідає другому поколінню систем МП з тим уточненням, що системи другого покоління використовують майже винятково синтаксичні й семантико-синтаксичні мови-посередники (система СЕТА).

Послідовне втілення ідеї мови-посередника привело до виникнення стратегії «універсальної семантичної мови», незалежної від конкретної вхідної і вихідної мови. Переваги такої стратегії очевидні. Однак сучасний стан семантичної теорії не залишає надій на успішну реалізацію цієї стратегії найближчим часом. Отже, системи МП третього покоління сьогодні розглядають як віддалену перспективу.

ЯК компенсація проблем, які виникли зі стратегією універсальної семантичної мови, розвивається кілька проміжних стратегій, які дають змогу суттєво покращити параметри промислових систем МП. Стратегія «звуження проблемної ділянки» пропонує розробникам МП орієнтуватися на вузькі тематичні сфери текстів. Це дає змогу суттєво зменшити словник системи МП і обмежитися тільки тими особливостями побудови мовної системи, які реально представлені в певній підмові. Ця стратегія універсальна для багатьох сфер прикладної лінгвістики — від лексикографії до лінгвістичного забезпечення інформацій-пошукових систем і систем штучного інтелекту. Стратегія «обмеженого машинного перекладу» дає змогу залучати до технологічного ланцюжка автоматичного перекладу людину — на етапі передредагування, постредагування чи в режимі опрацювання тексту (наприклад, для розрізнення синонімії й омонімії).

3. Машинний переклад: елементи типології систем. Комп’ютерні засоби перекладу звичайно поділяють на три великих групи: системи машинного перекладу, системи людино-машинного перекладу (ЛМП) і термінологічні бази/банки даних (ТБД). Системи власне машинного перекладу не виключають (і навіть, як правило, передбачають) участь людини на етапі передредагування і постредагування. У цьому випадку суттєво, що після введення тексту у систему переклад здійснюється без втручання людини. Використовуються тільки алгоритми і словники, введені в ЕОМ.

Системи людино-машинного перекладу, своєю чергою, поділяють на дві підгрупи: системи машинного перекладу з участю людини і системи людського перекладу з участю машини. У першому випадку комп’ютерна програма сама здійснює переклад, однак на певних етапах вона може звернутися до людини, запропонувавши їй, наприклад, вибрати найбільш вдале слово для перекладу, дати синонім для невідомого вислову чи визначити структуру складної синтаксичної конструкції. Нарешті, людський переклад з участю машини завжди здійснюється в режимі реального часу, причому основну частину роботи з перекладу бере на себе людина. Перекладач звертається до комп’ютера для автоматичного оброблення окремих фрагментів тексту, для виклику інформації з термінологічних банків даних (часто віддалених), для автоматичного форматування результувального тексту, перевірки орфографії і пунктуації тощо. Такі комп’ютерні системи інколи називають автоматизованим робочим місцем перекладача.

Термінологічні банки даних зручні тому, що їх легко модифікувати і дають змогу зафіксувати найостаннішу словникову інформацію з обраної проблемної ділянки. Часто їх використовують для створення звичайних двомовних і багатомовних словників, а також для розроблення автоматизованих словників систем МП. ТБД становлять важливу частину робочого місця перекладача.

4. Основні ділянки використання машинного перекладу. Початкові ілюзії про універсальність застосування МП швидко зникли. Власне, і попиту на машинний переклад художніх текстів практично не було. Ділянка текстів науково-технічної інформації стільки велика, що людський переклад просто не в стані її охопити. У службах науково-технічної інформації різних установ й організацій використання систем МП засвідчило високу ефективність. Вимоги до якості перекладу виявились досить низькими, що дало змогу використовувати в цій сфері системи МП першого покоління. Друга сфера використання МП — великі міжнародні організації, які використовують документи багатьох мовах. До таких організацій належить, наприклад, ООН і офіційні структури Євросоюзу, у яких документи мають з’являтися практично одночасно всіма мовами членів ЄС. Однак вимоги до якості перекладу тут досить високі і етап постредагування необхідний навіть для систем МП з хорошими характеристиками.

Третя велика ділянка використання МП — технічна документація. Експорт продукції — особливо високотехнологічної — вимагає перекладу великих масивів технічних описів та інструкцій. Так, експлуатаційна документація для літаків сягає 100 і більше тис. сторінок. Компанії, пов’язані з експортом, готові навіть нормувати внутрішню мову, використовувану для технічної документації, щоб полегшити автоматичний переклад цих документів на вихідну мову. Наприклад, в Європейській асоціації авіавиробників (European Association of Aerospace Manufactures) під керівництвом Ван Дейка був розроблений спеціальний стандарт АЕСМА «спрощеної англійської мови», який накладав серйозні обмеження на використовувану в документації лексику та синтаксичні конструкції. Цей стандарт використовує, зокрема, корпорація «Боїнг» ([Wojcik 1997]).

Сьогодні системи МП успішно функціюють у тих галузях, де або не вимагається абсолютної точності перекладу, або існують істотні обмеження на використання структур природної мови, де вхідна мова нормована і спрощена. До проблемних ділянок останнього типу належить, наприклад, підмова метеопрогнозів. У Канаді з 1975 р. у промисловому режимі функціонує система МП TAUM-METEO, яка перекладає тексти метеопрогнозів з англійської мови на французьку.

Основная литература

Апресян Ю.Д. и др. Лингвистическое обеспечение системы ЭТАП-2. М., 1988.

Бакулов А.Д., Леонтьева H.H. Теоретические аспекты машинного перевода // Искусственный интеллект. Справочник. Кн. 1. Системы общения и экспертные системы. М., 1990. С. 201-215.

Бакулов А. Д., Леонтьева Н. #., Шаляпина 3. М. Отечественные системы машинного перевода // Искусственный интеллект. Справочник. Кн. 1. Системы общения и экспертные системы. М., 1990. С. 248-260.

Бархударов Л. С. Язык и перевод. М., 1975.

Беляева Л. #., Откупщикова М. И. Автоматический (машинный) перевод // Прикладное языкознание. СПб., 1996. С. 360-388.

Комиссаров В. Н. Теоретические основы методики обучения переводу. М., 1997.

Леонтьева Н. #., Шаляпина 3. М. Современное состояние машинного перевода // Искусственный интеллект. Справочник. Кн. 1. Системы общения и экспертные системы. М., 1990. С. 216-261.

Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития // Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. М., 1989. С. 357-408.

Щерба Л. В. Опыты лингвистического толкования стихотворений. П. «Сосна» Лермонтова в сравнении с ее немецким прототипом // Щерба Л. В. Избранные труды по русскому языку. М., 1957. С. 97-109.

Эткинд Е. Г. Поэзия и перевод. М.—Л., 1963.

Якобсон Р. О лингвистических аспектах перевода // Якобсон Р. Избранные работы. М„ 1985. С. 361-368.

Виноградов В. С. Лексические вопросы перевода художественной прозы. М., 1978.

Влахов С, Флорин С. Непереводимое в переводе. М., 1980.

Дорошевский В. О задачах и проблемах перевода // Исследование по славянской филологии. М., 1974. С. 25-28.

Комиссаров В. Н. Слово о переводе. М., 1973.

Миньяр-Белоручев Р. К. Общая теория перевода и устный перевод. М., 1980.

Найда Ю.А. К науке переводить. М, 1978.

Райхштейн А. Д. Сопоставительный анализ немецкой и русской фразеологии. М., 1980.

Ревзин И. И.9 Розенцвейг В. Ю. Основы общего и машинного перевода. М., 1964.

Реформатский A.A. Перевод чи транскрипция? // Восточно-славянская ономастика. М., 1972. С. 311-333.

Рецкер Я. И. Теория перевода. М., 1974.

Федоров А. В. Введение в теорию перевода. М., 1958.

Федоров А. В. Основы общей теории перевода. М., 1968.

Швейцер А. Д. Перевод и лингвистика. ML, 1973.

Albrecht J. Linguistik und Obersetzung. Tübingen, 1973.

Catford J. A Linguistic theory of translation: an essay in applied linguistics. Oxford, 1965. (Рус. пер.: КатфордДж. Лингвистическая теория перевода. М.: УРСС, (в печати)).

Chesterman A. Memes of translation: the spread of ideas in translation theory. Amsterdam etc., 1997.

Conference interpreting: current trends in research / Ed. by Y. Gambier, D. Gile and Ch. Taylor. Amsterdam etc., 1997.

Diller H.-J., KorneliusJ. Linguistische Probleme der Übersetzung. Tübingen, 1978.

Fillmore Ch. J. Lexicography and ethnographic semantics // EURALEX'94. Plenary lecture. Amsterdam, 1994. P. 27-48.

Koller W. Einführung in die Übersetzungswissenschaft. 4. Aufl. Heidelberg-Wiesbaden, 1992.

Latyschew L.K. Übersetzungstheorie in Wort und Beispiel. M., 1981.

Ljudskanow A. Mensch und Maschine als Übersetzer. München, 1972.

Neubert A. Elemente der allgemeinen Theorie der Translation. Bucarest, 1970.

Königs F. Übersetzung in Theorie und Praxis: Ansatzpunkte für die Konzeption einer Didaktik der Übersetzung. Bochum, 1979.

Pöntiero G. The translator's dialogue / Ed. by P. Oiero and J. C. Sager. Amsterdam etc., 1997.

Rüiieka R. Schwer- und Unübersetzbares: Bemerkungen zur tschechischen und russischen Übersetzung von Th. Manns «Dr. Faustus» // FS für Erwin Wedel. München, 1991. S. 355-361.

Routledge encyclopedia of translation studies / Ed. by M. Baker. London, 1998.

Schleiermacher F. Methoden des Übersetzens. Darmstadt, 1973.

Text typology and translation / Ed. by A.Trosboig. Amsterdam etc., 1997.

Toury G. In search of a theory of translation. Tel Aviv, 1980.

Übersetzungswissenschaft. Eine Neuorientierung: zur Integrierung von Theorie und Praxis / Hrsg. von M. Snell-Homby. Tübingen, 1986.

Сорокин Ä В. Сборник рассказов. М., 1992.

Ortega у Gasset J. Miseria у Esplendor de la Traducciön — Elend und Glanz der

Übersetzung. Deutsch von G. Küpper. Stuttgart, 1956. Ortega у Gasset J. Miseria у Esplendor de la Traducciön — Elend und Glanz der

Übersetzung. Deutsch von K. Reiß. München, 1977. Webster J. Daddy-Long- Legs. London, 1967.

Webster J. Daddy-Long-Legs. Deutsch von Margret Boveri. Frankfurt am Main, 1979. Webster J. Judy Aboot. (= Daddy-Long-Legs). Deutsch von Maigrit Boesch-Frutiger. 1970.

Соседние файлы в папке Prikladna