Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
posibМОЙ4_Исправленный1.doc
Скачиваний:
94
Добавлен:
08.02.2016
Размер:
5.36 Mб
Скачать

Навчальний елемент 4.3. Автоматизований переклад і проблема штучного інтелекту

Результатом вивчення цього навчального елемента мають бути знання про:

  • Статистичні системи перекладу.

  • Проблему штучного інтелекту.

  • Можливість існування діючих систем перекладу третього рівня.

Порядок опрацювання навчального елемента

I. Опрацювати теоретичний матеріал.

II. Дати відповіді на питання для самоконтролю.

Питання для самоконтролю наведені в кінці навчального елемента.

III. Виконати практичне завдання.

Завдання для практичного виконання наведені в кінці навчального елемента.

Теоретичний матеріал

Штучний інтелект – це область дослідження, яка охоплює обчислювальні технології для виконання завдань, які, очевидно, вимагають інтелекту, коли вони виконуються людьми. Такі задачі включаються в задачі діагностики автомобілів, комп’ютерів та людей, в задачі проектування нових комп’ютерів, написання оповідань та симфоній, знаходження математичних теорем, збірки та огляду товарів на фабриках та підписання міжнародних угод, переклад текстів. З процесами доведення, навчання та сприйняття пов’язана технологія обробки інформації.

Фундаментальна проблема штучного інтелекту пов’язана з представленням, пошуком, сприйняттям знань та з процесом виводу інформації. Знання повинні бути доступними в багатьох формах: колекцій логічних тверджень, евристичних правил, процедур, статистичних кореляцій і т.д. Штучний інтелект тісно пов'язаний з проектуванням і розумінням схеми представлення знань. Як знання може бути представлено так, що воно, по-перше, може бути легко обґрунтовано, по-друге, може бути легко досліджено та оновлено, і, по-третє, легко може бути визначено, чи відноситься воно до конкретної проблеми?

Дослідження є ключовою проблемою, тому що часто легко створити рішення проблеми «в лоб», але такі рішення отримують поразку у всьому, крім «іграшкових» проблем. Розуміння техніки дослідження може допомогти нам запобігти «комбінаторному вибуху», який знищує спроби рішення «в лоб».

Вивід – це процес створення явного представлення знань на відміну від неявного. Його можна розглядати як створення знання. Дедуктивний вивід переходить від множини припущень, які називаються аксіомами, до нових тверджень, які логічно виводяться з аксіом. Індуктивний вивід типово починає з множини фактів, рис чи спостережень, і він робить узагальнення, описи та закони, які звітують за дану інформацію, і які можуть мати силу для передбачення нових фактів, рис чи спостережень.

Різницею між наукою та мистецтвом є те, що наука більшою мірою складається з доведених принципів, які були абстраговані від природи через процес емпіричного дослідження та логічної дедукції. Те що фізика є наукою є незаперечним. З іншого боку мистецтво більшою мірою є колекцією технік, прагматично розроблених для складного рівня, але не обов’язково логічно. Більшість кухарів погодяться з тим, що приготування їжі це скоріше мистецтво, ніж наука.

Штучний інтелект є як мистецтвом так і наукою. Діяльність по створенню інтелектуальних комп’ютерних систем використовує доведені математичні принципи, емпіричні правила, вивчення попередніх систем та евристичні, прагматичні технології програмування. Інформація, що зберігається в реляційних структурах даних може використовуватися в добре відомих технологіях комп’ютерних наук, таких як алгоритми пошуку по дереву. Область штучного інтелекту є захоплюючою через цей взаємозв’язок між мистецтвом та наукою. Є великий простір для творчості в штучному інтелекті, і зростає кількість зрілих ідей, які починають давати більш читку підтримку практиці штучного інтелекту.

Найбільш важливою метою штучного інтелекту є збільшення розуміння людиною процесів доведення, навчання та сприйняття. Це розуміння є бажаним через дві причини: воно потрібно для того, щоб будувати нові корисні інструменти і для того, щоб досягти більш зрілих поглядів на людський інтелект, ніж існують зараз. Розробка нових інструментів є важливою тому, що вони можуть мати комерційне значення, або вони можуть збільшити ефективність діяльності урядів та компаній. На думку автора, більш глибоке розуміння людського інтелекту і його недоліків є дуже важливим, тому що це може привести до пропозицій частинного вирішення багатьох політичних та релігійних конфліктів у світі, які наразі представляють велику загрозу людській расі.

В той час, як інтелектуальний виклик західної цивілізації розробникам штучного інтелекту було зроблено століття назад, тільки нещодавно на великій кількості програм було продемонстровано те, що його практично можна створити. Протягом початку та середини 60-х років дев’ятнадцятого сторіччя занадто амбіціозні проекти автоматизованого англо-російського перекладу не тільки отримали поразку в виробництві обіцяних систем, але й послабили повагу і ентузіазм до штучного інтелекту, як до області. Критики штучного інтелекту, деякі з яких були дуже «антикомп’ютерними» критикували ці ранні поразки та стверджували, що штучний інтелект є неможливим, хоча їхні аргументи зазвичай які зазвичай викладалися в нечіткій термінології феноменологічної психології, завжди були помилковими.

Сьогодні, однак, ця область відродилась. Багато вчених, інженерів та програмістів вивчають технологію штучного інтелекту та будують відповідні системи. Було сформовано національні та інтернаціональні організації присвячені штучному інтелекту, і зараз вони розвиваються. В США Американська Асоціація Штучного Інтелекту кожні 3-4 роки проводить конференції на яких доповідаються результати досліджень, пропонуються навчальні програми та проводяться виставки обладнання та книг.

Це, навіть, може зайти надто далеко. В поточному хвилюванні, що визвано штучним інтелектом, іноді звучать заяви, які не можуть бути доведені. Автор сподівається, що ця книга трохи допоможе триматися в межах області, шляхом представлення елементів штучного інтелекту такими, які вони є, описуючі їхні межі так само, як і їхні можливості.

На відміну від початку 60-х, сьогодні на багато глибше розуміння проблем та рішень в головних областях штучного інтелекту забезпечує тверду базу для багатьох систем та підприємств штучного інтелекту. Заплутаність перекладу природної мови ще не повністю зрозуміла. Однак, відомо достатньо для того, щоб конструювати корисні системи; деякі комерційні підприємства нещодавно були запущені для розробки комп’ютерних перекладачів. Машинне бачення зараз практично використовується в областях робо техніки, біомедичної мікроскопії та аналізу матеріалів, навіть не дивлячись на досягнення багато основних питань бачення ще не мають відповідей. Ринок для експертних систем починає відчинятися і зараз ми бачимо тільки декілька перших будинків того, що стане великою метрополією.

Протягом наступного десятиліття більшість інженерів штучного інтелекту вірогідно будуть розробляти експертні системи. їхньою роботою часто буде працювати з експертами в окремих областях, таких як медицина, корпоративне фінансування, астрофізика та антропологія для розробки підходящих представлень знань для кожної з цих областей. Знання повинно бути представлено у формі, в якій виводи можуть бути зроблені автоматично. Така робота кидає виклик і знаходиться в центрі інформаційної революції.

На додачу до розробки представлення знань, для користувачів повинні бути розроблені підходящі відображення та засобі доступу. Повинні бути розроблені інтерфейси природної мови та CRT з урахуванням специфічних можливостей для кожної прикладної програми.

Після того, як експертні системи були розроблені та відлажені вони вимагають технічного обслуговування. Мають додаватися нові знання; евристичні знання виявились низькосортними, їх необхідно замінити; мають застосовуватися нові технології. В таких областях як медична діагностика, доведення математичних теорем, антропологія і багато інших завжди мають простір для покращення. Схоже, що зміни, які робляться в експертних системах після їх установки, ще на довго забезпечують роботу практикам штучного інтелекту.

Деякі люди, що займаються штучним інтелектом, будуть вченими, які будуть продовжувати вивчати основні механізми машинного навчання і рішення задач. Ця область є достатньо багатою для того, щоб багато фундаментальних досліджень, таких як оптимальний пошук, вірогіднісне мислення та індуктивний вивід забезпечили наявність відкритих проблем на багато років.

Існування штучного інтелекту проливає нове світло на багато філософських питань. «Чи можуть машини думати?» Люди часто відчувають загрозу через можливість того, що машини можуть думати. Це породжує думку, що вони теж є машинами або що вони нічим не кращі за машини. Без розуміння того, як працюють машини, штучний інтелект є для них таємницею і машини можуть здаватися інструментом, з допомогою якого той, хто створив їх може замінити або подавити і контролювати людей.

Люди аргументують ці питання з вищім рівнем освіченості, ніж раніше, але дебати продовжуються. Чудове представлення деяких поглядів на цю проблему можна знайти в книзі Памели МакКордак «Машини, які думають».

Однією з філософських проблем штучного інтелекту є також практична проблема. Коли можна сказати, що штучного інтелекту буде досягнуто? Менеджеру, який хоче оцінити проект по створенню штучного інтелекту, може знадобитися спосіб відповісти на це питання. Традиційною відповіддю на це питання є те, що штучний інтелект проявляється в машині тоді, коли її роботу не можливо відрізнити від роботи людини, яка виконує таке ж саме завдання. Ця відповідь базується за пропозиції Алана Тюрінга, який стверджував, що порівняння з людиною є критерієм, за допомогою якого визначається, чи може машина думати. Тест Тюрінга полягає в тому, що людину і машину поміщають в одну кімнату, а іншу людину, «допитуючого», в окрему кімнату. Допитуючий може задавати питання або іншій людині, або машині, звертаючись до одного як А, а до іншого В. Однак допитуючому не кажуть, хто з А і В є людиною, а хто – машиною. Допитуючий не може бачити, або чути інших, він може тільки передавати повідомлення через посередника, в ролі якого може виступати система електронної пошти, або інша людина. Відповідаючи на питання А і В змагаються один з одним для того, щоб запевнити допитуючого, що він/вона є людиною. Якщо машина зможе перемогти в середньому так само часто, як людина, тоді вважається, що вона пройшла тест Тюрінга і згідно з цим частим критерієм, може думати. На практиці результат такого тесту, напевно, буде так само значною мірою залежати від задіяних людей як і від машини.

По мірі того, як ми стаємо більш досвідченими, ми усвідомлюємо, що питання, чи є система інтелектуальною, є поверховим. Ми повинні питати про типи, якість та кількість знань в системі, про типи виводу, які вона може робити на основі цих знань, на скільки добре спрямованою є її процедура пошуку, і які засоби автоматичного отримання знань забезпечені. Існує багато вимірів інтелектуальності, і вони взаємодіють один з одним.

Вивчення деяких галузей штучного інтелекту – формування понять, ієрархія абстракцій, представлення переконань і системи підтримки істинності – забезпечили доволі переконливі пояснення деяких інтелектуальних обмежень людей. Люди створюють упередження, автоматично формуючи узагальнення навіть коли це є статистично невірно. Люди готові приймати фантастичні переконання і підтримувати їх, як серйозні протиріччя, які забезпечують підтримку доволі переконливих пояснень для деяких питань, які емоційно визначаються як центральні. Що таке переконання? Чи можуть вони, або чи повинні вони бути представленими в системах так як би вони бузи знаннями? Чи є чоловік або жінка лише сукупністю його або її переконань? Чи може особа або особистість бути представлена в машині? Якщо так, чи є виконання цього моральним або аморальним? Які види законів повинні існувати для регулювання суспільства інтелектуальних машин?

Той факт, що штучний інтелект підіймає так багато таких питань, робить вклад в появу хвилювань стосовно штучного інтелекту. Довгі роки більшість вчених ставилися до комп’ютерів, як до доволі тупих інструментів. Все більше людей розуміють не тільки те, що комп’ютери змінюють спосіб, за допомогою якого наше суспільство обробляє інформацію, але й те, що ці ідеї обчислень приносять деякі інтелектуальні традиції в це питання, змінюючи те, як ми думаємо про себе. Штучний інтелект є центром всієї комп’ютерної революції.

Говорячи про системи третього рівня, що пов'язані з поняттям штучного інтелекту, слід зазначити, що системи такого типу розроблені лише для деяких дуже обмежених тематичних сфер. У цих системах остаточне рішення про вибір перекладного еквівалента приймається «блоком прийняття рішень» на основі так званої «бази знань» - формального опису фрагмента реального світу (його складових і можливих відносин між ними). Складність концептуальної й програмної реалізації таких систем очевидна.

Особливе місце в теорії й практиці машинного перекладу займають системи, засновані на статистичних моделях перекладних відповідностей.

Відповідно до статистичного підходу до конструювання систем автоматичного перекладу будь-яке слово однієї мови може бути перекладено будь-яким словом іншої мови тільки з різною ймовірністю. На першому етапі, етапі навчання, автомат повинен порівнювати оригінальні тексти і виконані людиною переклади цих текстів і реєструвати величини ймовірності різних перекладних еквівалентів. Паралельно на етапі навчання автомата, залежно від використовуваної моделі, реєструється або порядок слів у вихідному і вхідному реченні, або ймовірність перекладу двох- трислівних словосполучень. В результаті на підставі аналізу паралельних двомовних текстів автомат після етапу навчання складає словник найбільш імовірних еквівалентів. Після цього настає етап перекладу, коли автомат, користуючись складеним у такий спосіб імовірнісним словником, перекладає новий текст. У випадку неповноти словника навчання автомата продовжують на новому масиві паралельних текстів. Такою є загальна ідея. Звичайно, вона представлена спрощено - у дійсності обчислення ймовірності перекладних еквівалентів здійснюється з використанням складних формул, що враховують текстове оточення вихідного і вхідного слова. Ідея статистичного машинного перекладу з'явилася ще в п'ятидесяті роки, але зараз вона знову стає популярною. Відродження ідеї статистичного машинного перекладу можна пояснити:

а. великими технологічними можливостями сучасних комп'ютерів (пам'ять, швидкодія).

б. Наявністю великих обсягів двомовних паралельних текстів на машинних носіях.

в. Відсутністю чіткої і несуперечливої теорії перекладу, що змогла б витримати перевірку на комп'ютерній моделі.

Статистичні моделі перекладу активно розробляються в США й у деяких інших країнах. Ці моделі перекладу мають велике майбутнє.

З огляду на велике число факторів, що визначають якість перекладу (значна частина яких або не відома, або не піддається формалізації), статистичні моделі представляються поки єдиним надійним засобом опису перекладацького процесу.

Рекомендована література (див. “Список використаної і рекомендованої літератури”):

Основна: 10, 11, 14.

Додаткова: 1, 12,13, 14, 15, 16.

Питання для самоконтролю:

  1. На яких моделях базуються системи перекладу третього рівня?

  2. Дайте визначення поняття "штучний інтелект"?

  3. Системи якого рівня пов'язані з поняттям "штучний інтелект"?

  4. Що таке статистичні моделі перекладу?

  5. Чи існують сьогодні діючі системи переклади третього рівня?

Практичне завдання (виконати письмово):

  1. Зробити науково-технічний переклад за допомогою машинного перекладача, зробити аналіз помилок перекладу та висновки щодо видів текстів, які доцільно перекладати використовуючи машинні перекладачі.