Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
such_per.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
389.12 Кб
Скачать

Лекція №5,6

Сучасні технології автоматичного перекладу тексту

Автоматичний, або машинний переклад – один із напрямів автоматичної

обробки мови, що займається створенням автоматичних або автоматизованих систем перекладу науково-технічної та ділової прози.

З перших же кроків у машинному перекладі вималювалися три основні

інваріантні функціонально-процедурні блоки:

1) аналіз вхідного тексту за допомогою спеціального машинного словника та граматики;

2) перетворення результатів аналізу на інформацію, необхідну для побудови перекладеного еквівалента;

3) синтез вихідного тексту, що використовує два типи інформації: отриману на етапі трансферу та граматику синтезу вихідного тексту.

Машинний переклад еволюціонував від максимально спрощених версій

("лексиконних") до версій, "заглиблених" у смисл. Його еволюцію можна представити як "естафету" п'яти послідовних генерацій та, відповідно, типів систем:

1. Системи послівного перекладу (word-for-word translation), доповнені деякими

допоміжними граматичними конструкціями – системи, що здатні опрацьовувати лише окремі мовні ситуації в окремих випадках, але не здатні оперувати ними в цілому, тобто на рівні типів, класів, груп тощо.

2. Структурно-граматичні системи машинного перекладу, що базуються на

морфологічних кореляціях між вхідною та вихідною мовами -"морфологічні системи" – виявляються ефективними для організації перекладу в межах споріднених мов

(наприклад, українсько-російський машинний переклад та навпаки).

3. Структурно-граматичні системи машинного перекладу, що спираються на

синтаксичні кореляції між вхідною та вихідною мовами -"синтаксичні системи".

Центральною процедурою тут є синтаксичний аналіз вхідної фрази, яка далі транс-

формується в структурно-синтаксичний каркас вихідної фрази.

4. Структурно-семантичні системи машинного перекладу, що оперують

глибинними структурами вхідного та вихідного контекстів. В таких системах

передбачається багаторівневе опрацювання мовного матеріалу.

5. Автоматизовані робочі місця (станції) перекладача - інтерактивні

словниково-орієнтовані системи машинного перекладу з великими за обсягом і

деталізованими термінологічними словниками. Концепція – системи машинного

перекладу принципово неспроможні забезпечити його високу якість, тому вони не можуть цілком замінити користувача-перекладача, але мають допомагати йому.

Отже, наприкінці XX сторіччя машинний переклад існує вже не лише як

теоретична дисципліна з експериментальним супроводженням, але і як технологічна реальність. Проте, навіть при такому рівні розвитку сучасних систем автоматичного перекладу, не завжди вдається правильно перекласти деякі словосполучення у сферах професійного спрямування. Далі наведений список слів, які комп’ютер помилково перекладає (переклад відбувався за допомогою он-лайн перекладача сайту та програми-перекладача Pragma):

Похідний текст Результат Правильний переклад

ввода/вывода введення/виводу вводу/виводу (введення/виведення)

оборудование устаткування обладнання

ячейка осередок(чарунка) комiрка

питание харчування живлення

считывание прочитывание зчитування

вскрытие ключей розтин ключів розкриття ключів

временный тимчасовий часовий

Автоматизований переклад англ.переклад текстів на комп'ютері з використанням комп'ютерних технологій. Від машинного перекладу (МП) він відрізняється тим, що весь процес перекладу здійснюється людиною, комп'ютер лише допомагає йому створити готовий текст або за менший час, або з кращою якістю Ідея АП з'явилася з моменту появи комп'ютерів: перекладачі завжди виступали проти стандартної в ті роки концепції МП, на яку було напрямлено більшість досліджень в області комп'ютерної лінгвістики, але підтримували використання комп'ютерів для допомоги перекладачам. У 1960-і роки Європейське об'єднання вугілля та сталі (попередник сучасного Євросоюзу) почало створювати термінологічні бази даних під загальною назвою Eurodicautom[1]. У Радянському Союзі для створення баз такого роду був створений ВІНІТІ.

У сучасній формі ідея АП була розвинена у статті Мартіна Кея 1980 року [2], який висунув наступну тезу: "by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human" (комп'ютер бере на себе рутинні операції і звільняє людину для операцій, що вимагають людського мислення).

В даний час найбільш поширеними способами використання комп'ютерів при письмовому перекладі є робота із словниками та глосаріями, пам'яттю перекладів (англ. Translation Memory, TM), що містить приклади раніше перекладених текстів, а також використання так званих корпусів, великих колекцій текстів на одному або декількох мовах, що дає стислий опис того, як слова і вирази реально використовуються в мові в цілому або в конкретній наочній області.

Для локалізації програмного забезпечення часто застосовуються спеціалізовані засоби, наприклад Passolo, які дозволяють перекладати меню та повідомлення у програмних ресурсах і безпосередньо у скомпільованих програмах, а також тестувати коректність локалізації. Для перекладу аудіовізуальних матеріалів (головним чином фільмів) також використовуються спеціалізовані засоби, наприклад, Swift, які об'єднують в собі деякі аспекти пам'яті перекладів, але додатково забезпечують можливість появи субтитрів за часом, їх форматування на екрані, відповідності відеостандартам і т.п.

При синхронному перекладі використання засобів автоматизованого перекладу за необхідністю обмежено. Одним з прикладів є використання словників, що завантажуються на КПК. Іншим прикладів може служити напівавтоматичне витягання списків термінів при підготовці до синхронного перекладу у вузькій наочній області[3].

У вузьких наочних областях при великій кількості початкових текстів і сталої термінології перекладачі можуть використовувати і машинний переклад, який може забезпечити хорошу якість перекладу термінології і стійких виразів у вузькій області. Перекладач в цьому випадку здійснює пост-редагування отриманого тексту. Більше половини текстів всередині Єврокомісії (головним чином юридичні тести та поточна кореспонденція) перекладаються з використанням МП.

Приклади систем автоматизованого перекладу на ринку програмного забезпечення — Trados, SDLX, Transit, Wordfast, Deja Vu.

Автоматизований переклад це широке поняття, що охоплює різні засоби та інструменти. Вони можуть включати:

  • Програми для перевірки правопису, що вбудовуються у текстові редактори або окремі програми;

  • Програми для перевірки розділових знаків, що також можуть бути вбудованими у текстові редактори або додаткові програми;

  • Програми для керування термінологією, що дозволяють перекладачам керувати своєю власною термінологічною базою в електронній формі. Це може бути створена у текстовому редакторі звичайна таблиця, електронна таблиця, а також база даних, що збудована у програмі FileMaker Pro. Для більш трудомістких (та більш дорогих) рішень існує спеціальне програмне забезпечення на кшталт LogiTerm, MultiTerm, Termex та інше;

  • Словники на компакт-дисках, одномовні або багатомовні;

  • Термінологічні бази даних, що зберігаються на компакт-дисках або підключаються через мережу Інтернет, наприклад The Open Terminology Forum або TERMIUM;

  • Програми для повнотекстового пошуку (або індексатори), що дозволяють користувачу робити запити у раніше перекладених текстах або різних довідкових документах. У перекладацькому середовище найбільш відомі такі індексатори як Naturel, ISYS Search Software, and dtSearch;

  • Програми конкордансу, що дозволяють знаходити приклади слів або висловів у поширеному контексті в одномовному, двомовному та многомовному корпусах, як то бітекст або пам'ять перекладів;

  • Бітекст, що не є дуже новим винаходом, являє собою наслідок злиття первинного тексту та його перекладу, що може бути пізніше проаналізованим програмами для повнотекстового пошуку або конкордансу;

  • Програмне забезпечення для керування проектами, що дозволяє мовознавцям структурувати складні перекладацькі проекти, доручати різні завдання різним співробітникам, а потім наглядати за процесом їх виконання;

  • Менеджери пам'яті перекладів (ТММ), що складаються з бази даних сегментів тексту на первинній мові та їх перекладів на одну та більше цільових мов;

  • Майже повністю автоматичні системи, що нагадують машинний переклад, але дозволяють користувачу вносити поправки у сумнівних випадках. Іноді такі програми називають машинним перекладом за участю людини.

Лекція №7,8

Структура систем комп'ютерного перекладу

Ідея використання комп'ютера для автоматичного перекладу текстів виникла ще на початку появи обчислювальної техніки. Для автоматичного перекладу документів з однієї мови на іншу розроблено багато різних програм. Однак через складнощі опису семантики природних мов до цього часу остаточно проблему перекладу ще не вирішено. Проте сучасні засоби автоматизації перекладу досягли такого рівня, який дає змогу ефективно використовувати їх на практиці. Це пов'язано з тим, що в наукових, технічних, економічних та інших текстах, на відміну від художніх, використовується обмежена кількість мовних конструкцій, які більше орієнтовано на однозначну інтерпретацію.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]