Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторний практикум МCШІ - 2013 .doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.63 Mб
Скачать

Іii. Лінійні розділяючі функції і поверхні рішень.

1.1. Основні поняття теорії розпізнавання образів

Розпізнавання образів є складовою частиною методології математичної кібернетики і полягає в розробці принципів і методів класифікації та ідентифікації предметів, явищ, процесів, ситуацій, сигналів – усіх тих об’єктів, які можуть бути описані скінченою множиною ознак або властивостей, які характеризують даний об’єкт.

Описом об’єкта є -мірний вектор, де – число використаних для характеристики об’єкта ознак, причому -та координата цього вектора рівна значенню -ої ознаки, . В такому описі об’єкта допускається відсутність інформації про значення тої чи іншої ознаки.

Якщо необхідно здійснити класифікацію пред’явлених об’єктів по декількох групах (образах) лише на основі їх описів , причому число груп не обов’язково має бути відомим, то така задача розпізнавання образів називається задачею таксономії (кластера, навчання без вчителя, самонавчання). Для задач розпізнавання образів (навчання з учителем), крім опису об’єктів є необхідною додаткова інформація про належність цих об’єктів до того чи іншого класу (образу). Кількість класів скінчена і задана, а самі ці класи можуть і перетинатися.

Сукупність описів об’єктів, для яких відомі образи, до яких вони належать, утворюють так звану навчальну послідовність (набір еталонів). Основна задача розпізнавання образів полягає в тому, щоб на підставі навчальної послідовності визначити клас, до якого за даним описом належить деякий об’єкт, який підлягає даній класифікації чи ідентифікації. До такої схеми приводить будь яка задача прийняття рішень, якщо лише процес прийняття рішень базується в основному на вивченні раніше накопленого досвіду.

Прикладні задачі, які розв’язуються методами розпізнавання образів виникають при ідентифікації машинописних та рукописних текстів, ідентифікації фотозображень, при автоматичному розпізнаванні мови, в медичній діагностиці, при геологічному прогнозуванні, прогнозуванні властивостей хімічних сполук, оцінюванні економічних, політичних, виробничих ситуацій, при класифікації соціологічного матеріалу, і т.п. для розв’язку цих задач існує велика кількість так званих евристичних алгоритмів розпізнавання, орієнтованих на специфіку кожної конкретної задачі. Крім того, на основі певних інтуїтивних принципів будують моделі алгоритмів розпізнавання, тобто сімейства алгоритмів для розв’язку класифікаційних задач. Найчастіше використовуються наступні моделі: моделі, побудовані з використанням принципу розділення, який задає клас поверхонь, що розділяють образи; моделі, в основі побудови яких лежить принцип потенціалів; моделі обчислення оцінок (голосування); структурні моделі; статистичні моделі.

1.2. Випадок двох класів.

Розділяюча функція, що представляється лінійною комбінацією компонент вектора , може бути записана в наступному вигляді:

, (1)

де називається ваговим вектором, а величиною порогу. В основі лінійного класифікатора, при розділенні об’єктів на два класи, лежить наступне розділяюче правило: прийняти рішення , якщо , і , якщо . Таким чином, приписується до , якщо скалярний добуток перевищує поріг . Якщо , то припускають, що можна віднести до будь-якого з класів, хоча переважно, таку ситуацію вважають невизначеною.

Рівняння визначає поверхню рішень, яка відокремлює точки, що відповідають рішенню , від точок, яким відповідає рішення . Коли функція лінійна, дана поверхня є гіперплощиною. Якщо і , і належать до поверхні рішень, то справедливим є наступний вираз: , або , так що є нормаллю по відношенню до будь-якого вектора, що лежить в гіперплощині. В загальному гіперплощина ділить простір ознак на два підпростори: область рішень для і область рішень для . Оскільки , якщо знаходиться в області , то з цього випливає, що нормальний вектор направлений в сторону . В цьому випадку інколи говорять, що будь-який вектор , який знаходиться в області , лежить на додатній стороні гіперплощини , а будь-який вектор , який знаходиться в області , лежить на від’ємній стороні .

Розділяюча функція представляє собою алгебраїчну відстань від до гіперплощини. Це стає більш очевидним, якщо виразити в наступному вигляді:

, (2)

де – нормальна проекція на гіперплощина , а – відповідна алгебраїчна відстань, додатня, якщо знаходиться з додатньої сторони гіперплощини, і від’ємна, якщо знаходиться з від’ємної сторони гіперплощини. Тоді , оскільки ,

, (3)

або

. (4)

Зокрема, відстань від початку координат до гіперплощини виражається відношенням . Якщо , початок координат знаходиться з додатної сторони ; якщо – з від’ємної сторони. Якщо , то функція стає однорідною по відношенню по відношенню до , і гіперплощина проходить через початок координат.

Рис. 1. Лінійна границя областей рішень .

Таким чином розділяюча функція ділить простір ознак поверхнею рішень, яка представляє собою гіперплощину. Спосіб орієнтації даної поверхні задається нормальним вектором , а її положення – величиною порогу .