
- •Основні положення інформаційно-функціональної теорії розвитку техніки. Визначення і критерії ідентифікації систем штучного інтелекту.
- •Поняття: "Інтелект", класифікація інформаційних систем за ступенем інтелектуальності.
- •Системи з інтелектуальним зворотним зв'язком і інтелектуальними інтерфейсами.
- •Автоматизовані системи розпізнавання образів.
- •Автоматизовані системи підтримки прийняття рішень.
- •Експертні системи (ес).
- •Нейронні мережі.
- •Генетичні алгоритми і моделювання еволюції.
Автоматизовані системи розпізнавання образів.
Системою розпізнавання образів будемо називати клас систем штучного інтелекту, що забезпечують:
- Формування конкретних образів об'єктів і узагальнених образів класів;
- Навчання, тобто формування узагальнених образів класів на основі ряду прикладів об'єктів, класифікованих (тобто віднесених до тих чи інших категорій - класам) вчителем і складових навчальну вибірку;
- Самонавчання, тобто формування кластерів об'єктів на основі аналізу некласифікованої навчальної вибірки;
- Розпізнавання, тобто ідентифікацію (і прогнозування) станів об'єктів, описаних ознаками, один з одним і з узагальненими образами класів;
- Вимірювання ступеня адекватності моделі;
- Рішення зворотного завдання ідентифікації і прогнозування (забезпечується не всіма моделями).
Ознаками об'єктів будемо називати конкретні результати вимірювання значень їх властивостей. Властивості об'єктів відрізняються своєю якістю і вимірюються за допомогою різних органів сприйняття або вимірювальних приладів у різних одиницях виміру. Результатом вимірювання є зниження невизначеності в наших знаннях про значення властивостей об'єкта. Значення властивостей конкретизуються шляхом їх зіставлення певним градаціям відповідних вимірювальних шкал: номінальних, порядкових або відносин. У номінальних шкалах відсутні відносини порядку, початок відліку і одиниця виміру. На порядкових шкалах визначені відносини "більше - менше", але відсутні початок відліку і одиниця виміру. На шкалах відносин визначено відношення порядку, всі арифметичні операції, є початок відліку і одиниця виміру. Можна уявити собі, що шкали утворюють осі координат деякого абстрактного багатовимірного простору, який будемо називати "фазовим простором". У цьому фазовому просторі кожен конкретний об'єкт представляється певною точкою, що має координати, відповідні значенням його властивостей по осях координат, тобто градаціям описових шкал. Осі координат фазового простору в загальному випадку не є взаємно-перпендикулярними шкалами відносин, тобто в загальному випадку цей простір неортонормований, більше того - неметричний. Отже, в ньому в загальному випадку не застосовна Евклидова міра відстаней, тобто не застосовується Евклідова метрика. Застосування цього заходу відстаней коректно, якщо одночасно виконуються дві умови:
1. Всі осі координат фазового простору є шкалами відносин.
2. Всі осі координат взаємно-перпендикулярні або дуже близькі до цього.
Узагальнений образ класу формується з декількох образів конкретних об'єктів, що відносяться до даного класу, тобто однієї градації деякої класифікаційної шкали. Узагальнені образи класів формалізуються (кодуються) шляхом використання класифікаційних шкал і градацій, які можуть бути тих же типів, що і описові, тобто номінальні, порядкові і відносин. Сама приналежність конкретних об'єктів до даного класу визначаться або людиною-вчителем, після чого фіксується в навчальній вибірці, або самою системою автоматично на основі кластерного аналізу конкретних об'єктів. Навчальна вибірка є деяким підмножиною досліджуваної сукупності, яка називається "генеральна сукупність". На основі вивчення навчальної вибірки ми хотіли б зробити висновки про генеральну сукупність, причому важливо знати ступінь достовірності цих висновків. Розглянемо, як залежить ступінь достовірності висновків про генеральної сукупності від обсягу навчальної вибірки. Якщо навчальна вибірка включає всі об'єкти генеральної сукупності, тобто вони збігаються, то достовірність висновків буде найбільш високою (при всіх інших рівних умов). Якщо ж навчальна вибірка дуже мала, то навряд чи на її основі можуть бути зроблені достовірні висновки про генеральну сукупність, тому що в цьому випадку в навчальну вибірку можуть навіть не входити приклади об'єктів всіх або переважної більшості класів. Під репрезентативністю навчальної вибірки будемо розуміти її здатність адекватно представляти генеральну сукупність, так що вивчення самої генеральної сукупності можна коректно замінити дослідженням навчальної вибірки. Але репрезентативність залежить не тільки від обсягу, а й від структури навчальної вибірки, тобто від того, наскільки повно представлені всі категорії об'єктів генеральної сукупності (класи) і від того, наскільки повно вони описані ознаками. Зважування даних або ремонт навчальної вибірки - це операція, в результаті якої приватна розподіл об'єктів за класами в навчальній вибірці максимально, на скільки це можливо, наближається або до частотного розподілу генеральної сукупності (якщо воно відоме з незалежних джерел), або до рівномірного. Узагальнення - це операція формування узагальнених образів класів на основі описів конкретних об'єктів, що входять в навчальну вибірку. Відразу необхідно зазначити, що операція узагальнення реалізується далеко не у всіх моделях систем розпізнавання (наприклад, у методі k-найближчих сусідів), а в тих, в яких воно реалізується, - це робиться по-різному. Зазвичай, поки не реалізовано узагальнення немає можливості визначити цінність ознак для вирішення задачі ідентифікації. Розпізнавання - це операція порівняння і визначення ступеня подібності образу даного конкретного об'єкта з образами інших конкретних об'єктів або з узагальненими образами класів, в результаті якої формується рейтинг об'єктів або класів за зменшенням подібності з розпізнаваним об'єктом. Ключовим моментом при реалізації операції розпізнавання в математичній моделі є вибір виду інтегрального критерію або заходи подібності, який би на основі знання про ознаки конкретного об'єкта дозволив би кількісно визначити ступінь його схожості з іншими об'єктами або узагальненими образами класів. У ортонормованому просторі, осями якого є шкали відносин, цілком природним є використовувати в якості такої міри схожості Евклідова відстань. Однак, такі простору на практиці зустрічаються скоріше як виняток з правила, а операція ортонормування є досить трудомісткою в обчислювальному відношенні і призводить до збіднення моделі, а значить її не завжди зручно і доцільно здійснювати. Тому актуальною є задача вибору або конструювання інтегрального критерію подібності, застосування якого було б коректно і в неортонормованих просторах. Крім того, цей інтегральний критерій повинен бути стійкий до наявності шуму, тобто до неповноти і спотворення як у вихідних даних, так і самої чисельної моделі. Вимога стійкості до наявності шуму математично означає, що результат застосування інтегрального критерію до сигналу, що складається тільки з білого шуму, повинен бути рівним нулю. Це означає, що в якості інтегрального критерію може бути застосована функція, яка використовується при визначенні самого поняття "білий шум", тобто згортка, скалярний твір, кореляція. Навчання з вчителем - це процес формування узагальнених образів класів, на основі навчальної вибірки, яка містить характеристики конкретних об'єктів як в описових, так і в класифікаційних шкалах і градаціях. Причому, якщо описові характеристики можуть формуватися за допомогою інформаційно-вимірювальної системи автоматично, то класифікаційні - являють собою результат взагалі кажучи неформалізованим процесом оцінки ступеня приналежності даних об'єктів до різних класів, який здійснюється людиною-експертом або, як традиційно говорять фахівці з розпізнавання образів, " учителем ". У цьому випадку не виникає питання про те, для формування узагальненого образу яких класів використовувати опис даного конкретного об'єкта. Навчання без вчителя або самонавчання - це процес формування узагальнених образів класів, на основі навчальної вибірки, яка містить характеристики конкретних об'єктів, причому тільки в описових шкалах і градаціях. Тому цей процес реалізується в три етапи:
1. Кластерний аналіз об'єктів навчальної вибірки, в результаті якого визначаються групи найбільш схожих їх них за їх ознаками (кластери).
2. Присвоєння кластерам статусу узагальнених класів, для формування узагальнених образів яких використовуються конкретні об'єкти, що входять саме в ці кластери.
3. Формування узагальнених образів класів, аналогічно тому, як це робилося при навчанні з учителем.Як тільки вимовлено або написано слово "модель", відразу неминуче виникає питання про ступінь її адекватності.
Верифікація моделі - це операція встановлення ступеня її адекватності (валідності) шляхом порівняння результатів ідентифікації конкретних об'єктів з їх фактичної приналежністю до узагальнених образів класів. Розрізняють внутрішню і зовнішню, інтегральну та диференційну валідність. Внутрішня валідність - це здатність моделі вірно ідентифікувати об'єкти навчальної вибірки. Якщо модель має низьку внутрішню валідність, то модель не можна вважати вдало сформованою. Зовнішня валідність - це здатність моделі вірно ідентифікувати об'єкти, що не входять в навчальну вибірку. Інтегральна валідність - це середньозважена достовірність ідентифікації по всіх класах і розпізнаваним об'єктам. Диференціальна валідність - це здатність моделі вірно ідентифікувати об'єкти в розрізі по класах. Адаптація моделі - це облік в моделі об'єктів, що не входять в навчальну вибірку, але входять в генеральну сукупність, по відношенню до якої дана навчальна вибірка репрезентативна. Якщо моделлю вірно ідентифікуються об'єкти, що не входять в навчальну вибірку, то це означає, що ці об'єкти входять в генеральну сукупність, по відношенню до якої дана навчальна вибірка репрезентативна. Отже, на основі навчальної вибірки вдалося виявити закономірності взаємозв'язків між ознаками і приналежністю об'єктів до класів, які діють не тільки в навчальній вибірці, але мають силу і для генеральної сукупності. Адаптація моделі не вимагає зміни класифікаційних і описових шкал і градацій, а лише обсягу навчальної вибірки, і призводить до кількісному зміни моделі. Синтез (або повторний синтез - пересинтез) моделі - це облік в моделі об'єктів, що не входять ні в навчальну вибірку, ні в генеральну сукупність, по відношенню до якої дана навчальна вибірка репрезентативна. Це об'єкти з новими, раніше невідомими закономірностями взаємозв'язків ознак з приналежністю цих об'єктів до тих чи інших класах. Причому і ознаки, і класи, можуть бути як ті, які вже були відображені в моделі раніше, так і нові. Пересинтез моделі призводить до її якісної зміни.