
- •Тест Тьюринга
- •Лекція 2. Інтелектуальна інформаційна система
- •Властивості інформації
- •Вимір інформації
- •Інтелектуальна система - система або пристрій із програмним забезпеченням, що взмозі за допомогою вбудованого процесора настроювати свої параметри залежно від стану зовнішнього середовища.
- •Різновиди ііс
- •Класифікація задач, розв'язуваних ііс
- •Типова схема функціонування іс
МЕТОДИ ТА СИСТЕМИ ШТУЧНОГО ІНТЕЛЕКТУ
Кургаєв Олександр Пилипович - доктор технічних наук, професор кафедри інформаційних систем,
провідний науковий співробітник Інституту кібернетики ім. В.М. Глушкова НАН України.
Область наукових інтересів – системи обробки знань, представлених у формі наукової теорії.
ОСНОВНІ РОЗДІЛИ ТЕМ КУРСУ
Основні поняття та означення
Поняття штучного інтелекту
Поняття інтелектуальної системи (ІС) та інтелектуальної задачі (ІЗ)
Способи подання ІЗ та методи пошуку рішень
Способи подання ІЗ, іхні переваги та недоліки
Пошук рішення ІЗ у просторі станів. Методи «сліпого» та евристичного пошуків
Методи пошуку рішень ІЗ у разі зведення задач до сукупності підзадач
Представлення знань у СШІ
Знання та моделі представлення знань у СШІ
Продукційні моделі представлення знань
Управління пошуком рішень у продукційних системах
Вирішувачі проблем, засновані на знаннях
Семантичні сітки (СС): основні поняття, типи, способи опису та логічне виведення на СС
Фрейми: основні поняття, структура фрейма. Фреймові системи
Експертні системи (ЕС): призначення та принципи побудови; узагальнена архітектура; класи задач, які вирішуються за допомогою ЕС
Розробка ЕС: етапи розробки; придбання знань; пошук та пояснення рішень. Інженерія знань
Сучасні тенденції та підходи до створення СШІ
Сучасні програмні та інструментальні засоби створення СШІ: Visual Prolog, Allegro CLOS, CLIPS, JESS. Мови функціонального та логічного програмування
Онтологічний підхід до представлення та інтеграції знань у розподілених інформаційних середовищах типу Інтернет.
Лекція 1.
ОСНОВНІ ПОНЯТТЯ ШТУЧНОГО ІНТЕЛЕКТУ
Штучний інтелект (ШІ) - область досліджень по моделюванню інтелектуальної діяльності людини для рішення різних задач. ШІ перебуває на стику ряду наук: інформатики, мовознавства (математичної лінгвістики), психології (когнітивної науки) і філософії. Тобто вивчається міждисциплінарною наукою.
Тематика ШІ в даний час охоплює величезний перелік наукових напрямків, починаючи з таких задач загального характеру, як навчання і сприйняття, і закінчуючи такими спеціальними задачами, як гра у шахи, доказ математичних теорем, віршування і діагностика захворювань.
Інтелект полягає не в знанні істини, а в знанні, як поводитись в постійно мінливому й еволюціонуючому світі [Дж. Люггер Штучний інтелект]. Приблизно так само інтелект визначав відомий радянський філософ і логік В.Ф. Асмус: "інтелект - це мистецтво виживання".
ШІ – це одна з найновіших сфер науки. Штучний інтелект, як і будь-який напрямок сучасної науки, має багату передісторію. Перші праці в цій області почались незабаром після Другої світової війни, а сама її назва була запропонована в 1956 році.
Філософська ідея про заміну людини розумною машиною одержала найбільшого поширення в 60-80 роках. Основні теоретичні положення ШІ, а ШІ сьогодні - вершина інформаційних технологій, закладені саме в цей період.
Історія досягнень досліджень ШІ є дуже насиченою. Найважливіші з них наведено нижче
Рік Події й відкриття
1943 Породжуючі правила Поста; модель нейрона
Маккаллоха й Піттса
1954 Керування виконанням правил за допомогою
марковського алгоритму
1956 Дартмутська конференція; програма Logic Theorist
(Логік-теоретик); евристичний пошук; введення в
науковий обіг терміна "штучний інтелект"
1957 Винахід персептрона Розенблаттом; початок робіт над програмою GPS (General Problem Solver - універсальний
вирішувач задач) (Ньюелл, Шоу й Саймон)
1958 Мова штучного інтелекту LISP (Маккарті)
1962 Вихід із друку книги Розенблатта Principles of
Neurodynamics, присвяченої сприйняттю
1965 Застосування методу резолюції для автоматичного
доказу теорем (Робінсон); застосування нечіткої логіки для міркувань про нечітко задані об'єкти (Л. Заде);
початок робіт над першою експертною системою
DENDRAL (Фейгенбаум, Бьюкенен)
1968 Семантичні мережі, модель асоціативної пам'яті
(Квілліан)
1969 Математична експертна система MACSYMA (Мартін і Мозес)
1970 Початок робіт над мовою PROLOG (Колмерое, Русселл)
1971 Розробка системи розпізнавання мови HEARSAY I;
популярний виклад підходу на основі правил у книзі
Human Problem Solving (Ньюелл і Саймон)
1973 Створення експертної системи для медичної
діагностики МУСIN (Шортліфф), що потягло за
собою розробку системи GUIDON, концепції
інтелектуального навчання (Кленсі) і системи
TEIRESIAS, формулювання принципів застосування
засобу пояснення (Девіс) і створення ЕМYСIN,
першого командного інтерпретатора (Ван Мелле,
Шортліфф і Бьюкенен); розробка системи HEARSAY ІІ; застосування моделі класної дошки для організації співробітництва декількох експертів
1975 Фрейми подання знань (М. Мінський)
1976 Створення програми АМ (Artificial Mathematician –
автоматизований математик), що забезпечує творче
відкриття математичних понять (Ленат); застосування теорії доказів Демпстера-Шефера для проведення міркувань в умовах невизначеності; початок робіт над експертною системою PROSPECTOR, призначеною
для розвідки корисних копалин (Дуда, Харт)
1977 Розробка командного інтерпретатора експертної
системи ОРS (Форгі), попередника CLIPS
1978 Початок робіт над системою XCON/R1 (Макдермотт,
компанія DEC), призначеної для визначення
конфігурацій комп'ютерних систем DEC; розробка
системи Мета-DENDRAL, формулювання поняття
метаправил і обґрунтування принципу виводу правил по методу індукції (Бьюкенен)
1979 Застосування rete-алгоритма для швидкого зіставлення
із шаблонами (Форгі); початок комерціалізації
штучного інтелекту; створення компанії Inference Согр. (ця компанія випустила інструментальні засоби
експертних систем АRТ в 1985 році)
1980 Відкриття в області символьної логіки; засновано
компанію LMI для виробництва LISP машин
1982 Розробка математичної експертної системи SMP;
створення нейронної мережі Хопфілда; початок робіт у Японії над проектом комп'ютерів V покоління, чиєю
метою була розробка інтелектуальних комп'ютерів
1983 Створення інструментального засобу експертних систем КЕЕ (компанія IntelliCorp)
1985 Випуск версії 1 інструментального засобу експертних
систем CLIPS (агентство NASA). Ці програми вільно
доступні для використання на всіх комп'ютерах, а не
лише на дорогих LISP комп'ютерах спеціального
призначення
Зв'язок ШІ з іншими напрямками.
Вчені інших спеціальностей частіш за все вказують ШІ, нарівні із молекулярною біологією, як «область, в якій я більш за все хотів би працювати».
ШІ все ще відкриває можливості для втілення талантів кількох справжніх Ейнштейнів.
Одним з найважливіших, найважливішим після нафти й вугілля, уже став і надалі стане все більш переважаючим інформаційний ресурс, тобто інформація плюс технологія її обробки.
Сьогодні спостерігається бум розвитку комп'ютерних технологій, у їхню розробку вкладаються гроші, порівнянні з бюджетом ресурсовидобувних компаній. Проте, результати скоріш кількісні. Втім, можливо, що сучасні досягнення в цій області не рекламуються, оскільки мають явну військову спрямованість.
Серйозних змін в теорії ШІ варто очікувати, вочевидь в 20 р. нашого століття. Це обумовлено необхідністю узагальнення накопичених наукових знань, появи деякої єдиної теорії ШІ.
Історія розвивається циклічно, і нове століття, тим більше початок нового тисячоріччя, - це своєрідний старт для народів, держав, політиків, учених.
Відомі визначення ШІ розподіляються по чотирьох категоріях:
Системи, що міркують подібно до людей;
Системи, що міркують раціонально;
Системи, що діють подібно до людей;
Системи, що діють раціонально.
Тест Тьюринга
Для перевірки інтелектуальності комп’ютера А. Тьюринг ще у 1950 році (Turing А. "Computing machinery and intelligence") запропонував тест:
«Чи може машина міркувати?" «Чи здатна машина до розумної поведінки?".
Комп'ютер має працювати так, щоб людина не змогла визначити, з ким вона спілкується - з іншою людиною чи з машиною.
Зараз прийнято, що для проходження тесту Тьюринга комп'ютер повинен мати засоби:
обробки текстів на природній мові в обсязі, достатньому для спілкування з людьми;
представлення знань, з чиєю допомогою зможе записати в пам'ять те, що він взнає або прочитає;
автоматичного формування логічних виводів, що забезпечують використання збереженої інформації для пошуку відповідей на питання та виводу нових висновків;
машинного навчання, які дозволяють пристосовуватись до нових обставин та виявляти і екстраполювати ознаки стандартних ситуацій.
Окрім цього, щоб пройти повний тест Тьюринга, необхідні:
машинний зір для сприйняття об’єктів;
засоби робототехніки для маніпулювання об’єктами і переміщення у просторі.
Оці шість напрямків становлять основну частину штучного інтелекту.
Тематика ШІ традиційно включає дослідження систем, що відповідають найістотнішим ознакам поняття розумної діяльності:
розпізнавання, перетворення й розуміння образів (природно-мовних, зорових, тактильних й ін.),
рішення задач у просторі станів,
прийняття рішень, адаптація й навчання на основі накопиченого досвіду,
цілеспрямовану поведінку, самоорганізацію систем.
Розвиток теорії й створення систем ШІ зараз зв'язують із проблемою організації знань про світ у вигляді деяких структур, що адекватні реальним відношенням між предметами і явищами дійсності.
"Обробка знань - одна зі сфер практичного застосування ШІ, що припускає використання комп'ютером знань, якими володіє людина, для рішення проблем".
Відповідно до визначення знань, що використається в даному курсі й ілюструється рис. 1, знання входять до складу ієрархії способів подання інформації.
Рис. 1. Піраміда знань
На нижньому рівні цієї ієрархії перебуває шум, що складається з інформаційних елементів, які не представляють інтересу й можуть лише утруднити сприйняття й подання даних. На більш високому рівні перебувають безформатні дані, що містять елементи, які можуть становити певний інтерес. Далі перебуває інформація, тобто оброблені дані, що явно представляють інтерес для користувачів. Наступним є рівень знань, які представляють настільки важливу інформацію, що її варто надійно зберігати й забезпечити виконання над нею необхідних операцій. Назви найвищих двох рівнів достатньо красномовні.
Два підходи до побудови ШІ
• Логічний
- Моделювання логічного (вербального)
мислення
- Різні моделі подання знань
- Різні методи логічного виводу
- Різні методи формалізації знань
• Нейрокібернетичний
- Моделювання процесів асоціативної
обробки інформації нейронними мережами
- Різні види структур штучних нейронних мереж
- Різні парадигми навчання
Чому потрібний гібридний підхід -1
• Гідності логічного підходу
a) Відносно легка взаємодія між роботом і людиною;
b) Можливість програмування поведінки робота
• Недоліки логічного підходу
a) Він може бути використаний тільки у випадку відомого і детермінованого оточення
b) Він не орієнтований на сприйняття візуальних образів і тому дуже важко використовувати реальні об'єкти оточення для взаємодії з роботом
Чому потрібний гібридний підхід -2
• Гідності нейрокібернетичного підходу:
- Здатність сприймати образи з оточення
- Здатність навчатися поведінці в незнайомому середовищі
• Недоліки нейрокібернетичного підходу:
- Важко програмувати поведінку
- Важко спілкуватися з роботом природньою мовою
Чому потрібний гібридний підхід -3
• Гібридний підхід заснований на різних парадигмах, зокрема, на нейронних мережах і правилах або семантичних мережах або фреймах
• Гібридний підхід має переваги обох підходів і не має їхніх недоліків
Два види мислення в людини
• Образне (асоціативне)
• Логічне (вербальне)
• Мозок (розум) – їх комбінація
• Необхідна гібридизація двох підходів до ШІ
Два рівні подання й обробки знань
Вербальне (логічне) мислення
Асоціативне мислення
Образи (сигнали)
Керуючі сигнали
Свідомість
Підсвідомість
Знаки
Образи
Визначення 1. Система обробки знань (СОЗ) містить базу знань (у загальному випадку, скінчену множину баз знань), машину виводу (інтерпретатор), систему керування знаннями, систему спілкування і взаємодії та інтерфейс із користувачами й/або зовнішнім середовищем. Найістотніші ознаки компонент СОЗ:
база знань є машинною формою подання моделей предметних областей скінченого обсягу й довільної складності:
ізоморфних зв'язкам і відношенням між предметами і явищами деякого фрагмента дійсності,
нейтральних до вирішуємих задач,
відкритих для аналізу, доповнень, змін,
готових для ефективної цілеспрямованої активізації й застосування до даних в процесі рішення задач;
машина виводу:
формує й здійснює процес рішення задач, застосовуючи знання до даних,
формує результат, що є наслідком цього процесу,
підтримує функції системи керування знаннями, системи спілкування й взаємодії та інтерфейсу;
система керування знаннями:
управляє процесом рішення задач, формуючи завдання машині виводу цілеспрямованою активізацією знань,
виконує завдання машини виводу, завдання системи спілкування й взаємодії, і повертає отримані результати;
система спілкування й взаємодії здійснює в діалозі з користувачами й/або зовнішнім середовищем:
контроль і діагностику машини виводу;
редагування, накопичення знань,
відпрацювання й верифікацію баз знань, представлених у мові подання знань,
постановку й рішення задач,
пояснення результатів;
навчання користувачів можливостям і технології використання СОЗ для рішення проблем, знанням предметної області;
інтерфейс здійснює двоспрямований переклад між мовою подання знань і мовою (мовами) користувачів й/або зовнішнього середовища вхідних і вихідних повідомлень системи спілкування й взаємодії.
Поділ СОЗ на компоненти певною мірою умовний, оскільки вся система може бути виконана як інтегроване середовище розробки й застосування СОЗ, у якій функції одних компонентів включають функції інших, аж до рекурсивної вкладеності. Конкретні СОЗ можуть відрізнятись складом компонентів, набором їхніх функцій, рівнем розвитку функцій, врахуванням проблем предметної області, мовою подання знань, механізмами виводу, розмаїтістю джерел і механізмів вилучення, формування знань, реалізацією й іншими ознаками.
Сукупність істотних ознак СОЗ, наведених у визначенні 1, їхній склад, структура і смисл для конкретних систем відповідають споживчим ознакам цих систем.
Ключовими в цьому визначенні є поняття бази знань і гіпотеза про необхідність підлеглого положення комп'ютерів відносно людини при постановці й рішенні задач.
Останнє обґрунтовано положенням: "штучний інтелект займається розробкою машин, які були б більше - а не менш - слухняні, і більш - а не менш керовані. Розвиток техніки веде до того, що світ навколо нас стає усе більш складним і незбагненним, і якщо так буде тривати й надалі, то неминуче призведе до катастрофи. ШІ шукає способи повернути цей процес назад і повернути техніку на належне їй місце - слухняного й у той же час проникливого помічника людства".
Необхідність лідируючого положення людини обґрунтовується й тим, що сучасному комп'ютеру не під силу замінити людей при рішенні проблем, з якими, окрім дедуктивних, "зв'язані різного роду (високорівневі) виводи, для більшості з яких ще не отримані алгоритми їхньої автоматизації". Цього можна досягти лише доданням комп’ютерним системам все більшої людиноподібності не лише в їхніх зовнішніх проявах, але й у внутрішніх інформаційних процесах, зробивши їх легко доступними для розуміння й керування.
Наступне упорядковує різновиди СОЗ до деякого рівня деталізації.
Системи обробки знань:
По готовності до використання
Розробницького типу
Підтримки постановки й рішення проблем з побудовою моделей
Орієнтовані на проектування різновиду прикладної системи
експертних систем
планування дій роботів
управління рухомими об’єктами
багатоагентних систем
інших різновидів систем
Прикладні системи
Експертні системи
Управління роботів, рухомих об’єктів
Багатоагентні системи
Інші різновиди прикладних систем
За складом і функціям компонент
По моделі представлення знань:
символьні (фрейми, продукції, семантичні мережі, евристичні, змішані),
нейроподібні,
гібридні
За мовою представлення знань
За реалізацією мови представлення знань і/або компонент СОЗ
Програмні:
Мовою високого рівня
Мовою надвисокого рівня (ЛІСП, Пролог)
З апаратною підтримкою мови високого, надвисокого рівня, представлення знань
Архітектура й структура процесора орієнтовані на мову
Реконфігуровані структури
Багатопроцесорні структури