Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаби / 1.doc
Скачиваний:
17
Добавлен:
05.03.2016
Размер:
198.66 Кб
Скачать

Міністерство освіти і науки, молоді і спорту України

Тернопільський національний технічний університет

імені Івана Пулюя

Кафедра комп'ютерних наук

Лабораторна робота № 1

з курсу

«Системи штучного інтелекту»

Виконала:

ст. гр. СНспз-52

Герич О.Ю.

Перевірив:

Прошин С.Ю.

Тернопіль – 2013

Тема роботи: Розпізнавання образів.

Мета роботи: Вивчити принципи вирішення задачі розпізнавання образів інтелектуальними системами.

Теоретичні відомості

Образ, клас — класифікаційне угрупування в системі класифікації, об'єднуюче (виділяюче) певну групу об'єктів за деякими ознаками.

Образне сприйняття світу — одна із загадкових властивостей живого мозку, що дозволяє розібратись в безкінечному потоці інформації, що сприймається, і зберігати орієнтацію в розмаїтті розрізнених даних про зовнішній світ. Сприймаючи зовнішній світ, ми завжди проводимо класифікацію відчуттів, тобто розбиваємо їх на групи схожих, але не тотожних явищ. Наприклад, не дивлячись на істотну відмінність, до однієї групи відносяться всі букви А, написані різними почерками, або всі звуки, відповідні одній і тій самій ноті, взятій в будь-якій октаві і на будь-якому інструменті, а оператор, керівник технічним об'єктом, на цілу безліч достатків об'єкту реагує однією і тією ж реакцією. Характерно, що для створення поняття про групу сприйняття певного класу досить ознайомитися з незначною кількістю її представників.

Образи володіють характерною властивістю, що виявляється в тому, що ознайомлення з кінцевим числом явищ з однієї і тієї ж безлічі дає можливість взнавати скільки завгодно велике число його представників. Прикладами образів можуть бути: річка, море, рідина, музика Чайковського, вірші Маяковського і так далі Як образ можна розглядати і деяку сукупність достатків об'єкту управління, причому вся ця сукупність достатків характеризується тим, що для досягнення заданої мети потрібна однакова дія на об'єкт. Образи володіють характерними об'єктивними властивостями в тому сенсі, що різні люди, що виучуються на різному матеріалі спостережень, переважно однаково і незалежно один від одного класифікують одні і ті ж об'єкти. Саме ця об'єктивність образів дозволяє людям всього світу розуміти один одного.

Здатність сприйняття зовнішнього світу у формі образів дозволяє з певною достовірністю взнавати безкінечне число об'єктів на підставі ознайомлення з скінченим їх числом, а об'єктивний характер основної властивості образів дозволяє моделювати процес їх розпізнавання. Будучи віддзеркаленням об'єктивної реальності, поняття образу настільки ж об'єктивно, як і сама реальність, а тому це поняття може бути само по собі об'єктом спеціального дослідження.

В цілому проблема розпізнавання образів складається з двох частин: навчання і розпізнавання. Навчання здійснюється шляхом показу окремих об'єктів з вказанням їх приналежності тому або іншому образу. В результаті навчання розпізнаюча система повинна набути здатність однаково реагувати на всі об'єкти одного образу і по-різному – на всі об'єкти різних образів. Дуже важливо, що процес навчання повинен завершитися лише шляхом показів скінченого числа об'єктів без будь-яких інших підказок. Об'єктами навчання можуть бути або картинки, або інші візуальні зображення (букви), або різні явища зовнішнього світу, наприклад звуки, стани організму при медичному діагнозі, положення технічного об'єкту в системах управління, тощо. Важливе, що в процесі навчання вказуються лише самі об'єкти і їх приналежність образу. За навчанням слідує процес розпізнавання нових об'єктів, який характеризує дії вже навчанної системи. Автоматизація цих процедур і складає проблему навчання розпізнаванню образів. У випадку, коли людина сама розгадує або придумує, а потім нав'язує машині правило класифікації, проблема розпізнавання вирішується частково, оскільки основну і головну частину проблеми (навчання) людина бере на себе.

Проблема навчання розпізнаванню образів цікава як з прикладної, так і з принципової точки зору. З прикладної точки зору вирішення цієї проблеми важливе перш за все тому, що воно відкриває можливість автоматизувати багато процесів, які до цих пір пов'язували лише з діяльністю живого мозку. Принципове значення проблеми тісно пов'язане з питанням, яке все частіше виникає у зв'язку з розвитком ідей кібернетики: що може і що принципово не може робити машина? Якою мірою можливості машини можуть бути наближені до можливостей живого мозку? Зокрема, чи може машина розвинути в собі здатність перейняти у людини вміння проводити певні дії залежно від ситуацій, що виникають в оточуючому світі? Поки стало ясно лише те, що якщо людина може спочатку сама усвідомити своє вміння, а потім його описати, тобто вказати, чому вона проводить дії у відповідь на кожний стан зовнішнього середовища або як (за яким правилом) вона об'єднує окремі об'єкти в образи, то таке уміння без принципових труднощів може бути передане машині. Якщо ж людина володіє умінням, але не може пояснити його, то залишається лише один дорога передачі уміння машині — навчання прикладами.

Круг завдань, які можуть вирішуватися за допомогою систем, що розпізнають, надзвичайно широкий. Сюди відносяться не лише завдання розпізнавання зорових і слухових образів, але і завдання розпізнавання складних процесів і явищ, що виникають, наприклад, при виборі доцільних дій керівником підприємства або виборі оптимального управління технологічними, економічними, транспортними або військовими операціями. У кожному з таких завдань аналізуються деякі явища, процеси, достатки зовнішнього світу, усюди далі звані об'єктами спостереження. Перш ніж почати аналіз якого-небудь об'єкту, потрібно отримати про нього певну, яким-небудь чином впорядковану інформацію. Така інформація є характеристикою об'єктів, їх відображенням на безлічі сприймаючих органів розпізнаючої системи.

Але кожен об'єкт спостереження може впливати по-різному, залежно від умов сприйняття. Наприклад, яка-небудь буква, навіть однаково написана, може в принципі як завгодно зміщуватися відносно сприймаючих органів. Крім того, об'єкти одного і того ж образу можуть досить сильно відрізнятися один від одного і, природно, по-різному впливати на сприймаючі органи.

Кожне відображення об'єкту на сприймаючі органи розпізнаючої системи незалежно від його положення відносно цих органів, прийнято називати зображенням об'єкту, а безліч таких зображень, об'єднана якими-небудь спільними властивостями, є образами.

При вирішенні завдань управління методами розпізнавання образів замість терміну "зображення" застосовують термін "стан". Стан – це певної форми відображення вимірюваних поточних (або миттєвих) характеристик спостережуваного об'єкту. Сукупність станів визначає ситуацію. Поняття "ситуація" є аналогом поняття "образ". Але ця аналогія не повна, оскільки не всякий образ можна назвати ситуацією, хоча всяку ситуацію можна назвати образом.

Будь-яке зображення, яке виникає в результаті спостереження об'єкту в процесі навчання, можна представити у вигляді вектора, а значить і у вигляді точки деякого простору ознак. Якщо стверджується, що при показі зображень можливо однозначно віднести їх до одного з двох (або декілька) образів, то тим самим стверджується, що в деякому просторі існує дві (або декілька) області, що не мають спільних точок, і що зображення це точки з цих областей. Кожній такій області можна приписати ім’я, тобто дати назву, відповідну образу.

Проінтерпретуємо тепер в термінах геометричної картини процес навчання розпізнаванню образів, обмежившись випадком розпізнавання лише двох образів. Заздалегідь вважається відомим тільки те, що потрібно розділити дві області в деякому просторі і що показуються точки лише з цих областей. Самі ці області заздалегідь не визначені, тобто немає яких-небудь відомостей про розміщенні їх кордонів або правил визначення приналежності точки до тієї або іншої області.

В ході навчання пред'являються точки, випадково вибрані з цих областей, і повідомляється інформація про те, до якої області належать точки, що пред'являються. Жодній додатковій інформації про ці області, тобто про розташування їх кордонів, в ході навчання не повідомляється. Мета навчання полягає або в побудові поверхні, яка розділяла б не лише показані в процесі навчання точки, але і решта точок, що належать цим областям, або в побудові обмежуючих ці області поверхонь так, щоб в кожній з них знаходилися лише точки одного образу. Інакше кажучи, мета навчання полягає в побудові таких функцій від векторів-зображень, які були б, наприклад, позитивні на всіх точках одного і негативні на всіх точках іншого образу. У зв'язку з тим, що області не мають спільних точок, завжди існує ціла безліч таких розділяючих функцій, а в результаті навчання має бути побудована одна з них.

Якщо зображення належать не двом, а більшому числу образів, то завдання полягає в побудові по показаних в ході навчання точках розділяючої поверхні всі області, відповідні цим образам, один від одного. Завдання це може бути вирішене, наприклад, шляхом побудови функції, приймаючої над точками кожної з областей однакове значення, а над точками з різних областей значення цієї функції має бути різним.

На перший погляд здається, що знання всього лише деякої кількості точок з області недостатньо, щоб відокремити всю область. Дійсно, можна вказати безкінечну кількість різних областей, які містять ці точки, і як би не була побудована по ним поверхня, що виділяє область, завжди можна вказати іншу область, яка пересікає поверхню і в той же час містить вказані точки. Проте відомо, що задача про наближення функції по інформації про неї в обмеженій кількості точок, істотно більш вужчою, ніж вся безліч, на якій функція задана, є звичайним математичним завданням про апроксимацію функцій. Зрозуміло, вирішення таких завдань вимагає введення певних обмежень на класі даних функцій, а вибір цих обмежень залежить від характеру інформації, яку може додати вчитель в процесі навчання. Однією з таких підказок є гіпотеза про компактність образів. Інтуїтивно ясно, що апроксимація розділяючої функції буде завданням тим більше легкою, чим компактніші і чим більш рознесені в просторі області, що підлягають розділенню.

Поряд з геометричною інтерпретацією проблеми навчання розпізнаванню образів існує і інший підхід, який називається структурним, або лінгвістичним. Пояснимо лінгвістичний підхід на прикладі розпізнавання зорових зображень. Спочатку виділяється набір вихідних понять – типових фрагментів, що зустрічаються на зображеннях, і характеристик взаємного розташування фрагментів – "зліва", "знизу", "всередині" і так далі Ці вихідні поняття утворюють словник, що дозволяє будувати різні логічні припущення. Завдання полягає в тому, щоб з великої кількості припущень, які могли б бути побудовані з використанням цих понять, відібрати найбільш суттєві для даного конкретного випадку.

Далі, переглядаючи скінчене і по можливості невелике число об'єктів з кожного образу, потрібно побудувати опис цих образів. Побудовані описи мають бути настільки повними, щоб вирішити питання про те, до якого образу належить даний об'єкт. При реалізації лінгвістичного підходу виникають два завдання: завдання побудови вихідного словника, тобто набір типових фрагментів, і завдання побудови правил опису з елементів заданого словника.

В рамках лінгвістичної інтерпретації проводиться аналогія між структурою зображень і синтаксисом мови. Прагнення до цієї аналогії було викликане можливістю використовувати апарат математичної лінгвістики, тобто методи за своєю природою є синтаксичними. Використання апарату математичної лінгвістики для опису структури зображень можна застосовувати лише після того, як проведена сегментація зображень на складові частини, тобто вироблені слова для опису типових фрагментів і методи їх пошуку. Після попередньої роботи, що забезпечує виділення слів, виникають власне лінгвістичні завдання, що складаються із завдань автоматичного граматичного розбору описів для розпізнавання зображень. При цьому виявляється самостійна область досліджень, яка вимагає не лише знання основ математичної лінгвістики, але і опанування прийомів, які розроблені спеціально для лінгвістичної обробки зображень.

Соседние файлы в папке Лаби