Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Машинний переклад.doc
Скачиваний:
10
Добавлен:
22.11.2018
Размер:
80.38 Кб
Скачать

4. Типологiя та принципи функцiонування систем машинного перекладу

В основi iнженерно-лiнгвiстичного пiдходу до проблематики машинного перекладу має лежати лiнгвiстична класифiкацiя систем МП. Iз лiтератури нам вiдомi такi принципи класифiкацiї:

а) За участю ЕОМ у процесi перекладу, обсягу роботи, яку вона “бере на себе”, системи МП подiляються на автоматизованi та автоматичнi. Першим в англiйськiй мовi вiдповiдає термiн MAT (machine-aided translation), тобто переклад, який виконується за допомогою машини, а другим - MT - machine translation), тобто машинний переклад як такий.

В автоматизованих системах МП людина є обов’язковим учасником процесу перекладу. На частку машини в них відводиться виконання тiльки рутинних операцiй - пошук слiв i словосполучень в автоматичному словнику та вивiд їхнього перекладу на екран з можливою наступною вставкою у вихiдний текст. Навпаки, в автоматичних системах машина здiйснює аналiз вхiдного тексту та синтез вихiдного, так що переклад, хоча й має неминучi лексичнi, граматичнi, стилiстичнi помилки, в цiлому є зрозумiлим користувачевi й може бути використаний у виглядi iнформацiйного документа, який у певній мiрi може замiнити оригiнал. У той же час, такi системи, як правило, мають засоби редагування машинного продукту, що особливо важливо при перекладi текстiв, якi мають статус документiв у прямому значеннi цього слова, наприклад, технiчної документацiї, яка поставляється за кордон разом з устаткуванням, що експортується.

б) За кiлькiстю мов, що їх “розумiє” система. Вiдповiдно до даного критерiю будемо розрiзняти двомовнi та багатомовнi системи. Першi здiйснюють переклад для однiєї мовної пари. Якщо ж система охоплює бiльше однiєї мовної пари, вона є багатомовною.

У розвиток цього пункту доцільно взяти до уваги також такий пiдроздiл систем МП, як оборотнiсть (англiйський термiн - “two-way systems”) i необоротнiсть (“1-way systems”). Системи першого типу перекладають текст тiльки “в один бiк”, а системи другого типу - “в обидвi сторони”.

в) За типом документiв, на переклад яких орiєнтована система. Зокрема, iснують системи, якi працюють тiльки з заголовками документiв (наприклад, патентiв); iншi - здебiльшого з технiчними специфiкацiями тощо. Iснують також унiверсальнi системи, якi можуть на однаковому рiвнi ефективностi перекладати тексти рiзноманiтних типiв (try-anything systems - термiн Веронiки Лоусон).

Промисловi системи МП розрiзняються в залежностi вiд тематичних галузей, що покриваються ними. Визначимо при цьому, що в сучасних системах МП програмне забезпечення залежить тiльки вiд структури лiнгвiстичного забезпечення, але не вiд конкретного наповнення автоматичного словника, i треба розрiзняти саме словники систем, а також практичну можливiсть їх поширення.

г) За суто лiнгвiстичним принципом класифiкацiї системи МП подiляються на:

- системи, що реалiзують прямий переклад (direct translation);

- системи, якi базуються на трансферi (transfer approach);

- системи з мовою-посередником (interlingua approach).

Названі системи представляють особливий iнтерес для комп’ютерної лiнгвiстики. Вони, згiдно з задумом їх авторiв, повиннi реалiзувати вiдповiдно I, II i III рiвнi “розумiння” вхiдного i вихiдного текстiв. Бiльш того, цiлком природним здається те, що автори цiєї класифiкацiї вважають, що, чим вищим є рiвень “розумiння”, тим вищою буде якiсть перекладу.

а) Системи прямого перекладу будуються, виходячи з такого мiркування: маємо двi конкретнi мови, на які настроюється дана конкретна система; в основному iнформацiя знаходиться в лексицi, тому - в основному - достатньо правильно перекласти лексику вхiдного тексту, для чого, зрозумiло, необхiдно зняти багатозначнiсть, яка заважає цьому (в першу чергу граматичну), i привести в мiнiмально необхiдну вiдповiднiсть вхiднiй синтаксичнiй структурi вихiдну структуру, щоб лексика вихiдного тексту, яка перекладається, справдi передавала закладену в текстi інформацiю. Цi системи, по сутi, розвивають фiлософiю дескрипторних автоматичних систем. Вони придiляють основну увагу лексицi, iгноруючи “глобальний” синтаксис речення i спираючись на мiнiмальний контекст. Останнiй при цьому розглядається як квазiсинтаксичне утворення: аналiзуються граматичнi характеристики слiв i їх взаємне розташування, але не синтаксична, iєрархiчна органiзацiя речення чи (хоча б) його фрагментiв. Важливо пiдкреслити, що при прямому перекладi речення i аналiзується, i синтезується не у виглядi синтаксичного утворення, а як сукупнiсть лiнiйних фрагментiв. Безумовно, в цiй лiнiйностi синтаксичнi зв’язки i залежностi враховуються, але непрямо i далеко не в повному обсязi.

Суть прямого перекладу - в гiпотезi, згiдно з якою надлишковiсть мови є такою, що правильний переклад лексики компенсує помилки в граматицi. Можна також припустити, що, чим ближче синтаксичне оформлення текстiв двох мов, тим вищою буде якiсть перекладу. А навпаки? Наскiльки достатньою є надлишковiсть? Наскiльки знань користувача з предметної галузi достатньо для того, щоб зрозумiти граматично помилковi фрагменти? На цi питання краще всього вiдповiдає оцiнка машинних перекладiв, виконаних такими системами. Зараз визначимо лише, що, як показує практика, системи прямого перекладу можуть претендувати, в першу чергу, на одержання сигнальних перекладiв, тому що якiсть вихiдного продукту в них є далекою вiд iдеалу, якщо йдеться про новий текст, який, ранiше не опрацьовувався системою.

б) Грубому прямому перекладу протиставляється трансфер-пiдхiд. Його iдея: якщо при прямому перекладi лексика часто “не працює” через неврахування синтаксичної ролi слiв, то необхiдно виявити синтаксичну структуру вхiдного речення, трансформувати її у структуру мови перекладу i тiльки потiм - перекладати на лексичному рiвнi, тобто пiдставляти слова в синтаксичну структуру вихiдного тексту.

Переклад, виконаний системою з використанням трансферу, буде кращий, нiж переклад, виконаний системою прямого перекладу, якщо задовольняються три умови:

- вдалим був аналiз вхiдного тексту, тобто система вiрно розпiзнала синтаксичну структуру тексту; - словник правил трансферу досить повний;

- структури вхiдного та вихiдного текстiв розрiзняються, так що перетворення є необхiдним.

Отже, тотальнiй вiдмовi вiд синтаксичного аналiзу протиставляється теж тотальний синтаксичний аналiз. При цьому зрозуміло, що синтаксичний аналiз без урахування семантики слiв не буде повноцiнним.

Як бачимо, труднощi у обох методик схожі: необхiднiсть заздалегiдь, у словнику, тобто на рiвнi мови, завбачити поведінку слiв у текстi, тобто на рiвнi мовлення. При цьому прямий переклад передбачає менше, i це потребує менше iнформацiї при утвореннi словника, що спрощує цей процес, але вiдсутнiсть частини важливої iнформацiї про слова та граматику призводить до помилок; трансфер-переклад потребує бiльше iнформацiї, словник поповнювати складнiше, при аналiзi, синтезi й трансферi враховується бiльше зв’язкiв, а значить - з’являються помилки, викликанi тим, що ми бiльше хочемо дізнатися про речення, а також тим, що можливi помилки при введення слiв у словник.

Справдi, при прямому перекладi нас не цiкавлять синтаксичнi зв’язки, точнiше, вся їх маса, а значить, помилок, що виявляються у неiснуючих зв’язках, просто немає. Зате, з iншого боку, трансфер-пiдхiд у рядi випадкiв позбавляє вiд помилок прямого перекладу, тому що не робить прямих, “пiдрядкових” пiдстановок слiв, а значить, не робить i вiдповiдних помилок. Практика показує, що трансфер-системи, що мають, здавалося б, вищу розпiзнавальну спроможнiсть, нiж системи прямого перекладу, мають не бiльш високi показники якостi перекладу. Наприклад, система нiмецько-англiйського перекладу METAL має процент правильно перекладених речень 45% -85%, залежно вiд того, чи новi це тексти для системи. Причина тут в тому, що залучення синтаксичної iнформацiї саме по собi не може не дати помилок. Трансфер-переклад, таким чином, будучи гiпотетично ефективнiшим за прямий переклад, на практицi в цiлому працює не краще щодо загальної якостi вихiдного тексту, якщо тiльки не демонструвати його переваги на заздалегiдь пiдготовлених прикладах. У той же час, не слiд забувати принаймнi двi його переваги перед прямим способом:

  • деякi конструкцiї принципово не пiдлягають прямому перекладу (наприклад, - I saw her walking) i мають опрацьовуватися з використанням правил трансферу;

- за допомогою трансферу значно легше будувати багатомовнi системи, i ця перевага є тим значнiшою, чим у системi бiльше мов i необхiдно реалiзувати переклад з однієї мови на другу: аналiзiв i синтезiв треба стiльки, скiльки опрацьовується мов, i для кожної пари необхiдно задати правила трансферу, тодi як при прямому перекладi потрiбно будувати стiльки систем, скiльки маємо мовних пар.

в) Щодо систем з мовою-посередником, то однiєю з головних передумов їх побудови є бажання суттєво спростити розробку багатомовних систем, а також iстотно пiдвищити якiсть перекладу. Суть засобу полягає в тому, що, незалежно вiд мови, текст на етапi аналiзу перетворюється не в прив’язаний до цiєї мови структурний вираз, а в незалежний вiд конкретних мов опис, що передає змiст вхiдного тексту. Пiсля цього смислове подання перетворюється в текст на вихiднiй мовi. Безумовно, досвiдченi перекладачi працюють саме так: не бездумно “транслюють” вхiдний текст на вихiдну мову, а спочатку розумiють змiст тексту, що перекладається, i лише потiм працюють з цим змiстом.

Очевидно, при реалiзацiї даного засобу лiнгвiсти зустрічаються з тими ж проблемами, що й розробники трансфер-систем, хiба що цих проблем iстотно бiльше у зв’язку iз залученням широкої семантичної iнформацiї, формалiзувати яку, як ми вже бачили, дуже складно.

Можливо, різні системи перекладуть один i той ж текст з приблизно однаковими показниками якостi, але зроблять при цьому рiзнi помилки. Ця гiпотеза потребує перевiрки для пошуку нових, бiльш ефективних засобiв перекладу. Одним iз таких шляхiв може виявитися розробка гiбридних систем, якi поєднують можливостi прямого перекладу й трансферу.