Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторний практикум МCШІ - 2013 .doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.63 Mб
Скачать

Статистичні методи розпізнавання.

2.1. Основи байєсівського підходу.

Основна перевага статистичних методів розпізнавання полягає в тому, що є можливість одночасного врахування ознак різної фізичної природи, оскільки вони характеризуються безрозмірними величинами – ймовірностями їх появи при різних станах системи. Серед методів розпізнавання метод оснований на узагальненій формулі Байєса незважаючи на свою простоту є досить ефективним. До недоліків цього методу відносять: необхідність великих обсягів (статистично достатніх) попередньої інформації та низька чутливість до варіантів рішень, які є рідкісними подіями. Проте у випадках, коли обсяг статистичних даних дозволяє застосувати метод Байєса, його доцільно використовувати як один з найбільш надійних і ефективних методів.

Суть методу полягає в наступному. Нехай в результаті контролю працездатності системи, який полягає в розпізнаванні функціональних станів цієї системи виявлено деяку ознаку , де – множина ознак, і на цій підставі прийнято варіант рішення, тобто поставлено діагноз , де – множина варіантів діагнозів. Імовірність сумісної появи подій – розпізнано ознаку і поставлено діагноз – може бути визначена як

. (12)

Тоді, імовірність – постановка даного діагнозу при розпізнаванні ознаки визначається з співвідношення

. (13)

Співвідношення (13) називають формулою Байєса. Для користування цією формулою дуже важливо визначити точний смисл усіх величин, які в неї входять.

– імовірність діагнозу , яка визначається на основі статистичних даних (апріорна імовірність рішення). Наприклад, якщо попередньо досліджено об’єктів і для об’єктів було прийнято рішення , то .

– імовірність появи ознаки в об’єктів, для яких було прийнято рішення , тобто, якщо серед об’єктів, для яких прийнято рішення , ознака , виявлена у об’єктів, то .

– імовірність появи ознаки у всіх об’єктів незалежно від того чи було прийняте рішення чи ні, тобто якщо з загального числа об’єктів ознака була виявлена в об’єктів, то . Для прийняття рішення спеціальне обчислення імовірності не потрібне, оскільки відомі для усіх можливих станів значення і визначають величину .

– імовірність прийняття рішення після того як стало відомо про наявність в розпізнаваного об’єкта ознаки (апостеріорна імовірність рішення).

Якщо розпізнавання здійснюється на підставі комплексу ознак , причому кожна ознака може бути представлена декількома градаціями . Такий комплекс ознак є фактично формалізованим описом еталону, з допомогою якого здійснюють ідентифікацію знайдених, подібних до нього об’єктів, і які відповідають рішенням стосовно вибраного діагнозу .

В результаті розпізнавання об’єктів, явищ, ситуацій стають відомими значення реалізацій кожної з виявлених і розпізнаних ознак , а отже і всього комплексу . Формула Байєса для комплексу ознак має вид

, (14)

де – імовірність рішення, на підставі якого ставиться діагноз , після того, як стали відомі результати розпізнавання за набором ознак , а –попередня ймовірність рішення (на основі попередньої статистики).

Якщо кількість ознак в комплексі , то значення ймовірності визначають з допомогою співвідношень: у випадку залежних ознак

, (15)

або у випадку незалежних ознак

. (16)

При великій кількості ознак в більшості практичних задач можна припустити незалежність ознак навіть при істотних кореляційних зв’язках між ними.

Імовірність розпізнавання комплексу ознак рівна

. (17)

Тоді, враховуючи (15) узагальнена формула Байєса матиме вид

, (18)

де може бути визначена з допомогою (15) або (16). Очевидно, що має мати місце умова . Оскільки один з діагнозів обов’язково реалізується, а реалізація одночасно двох і більше неможлива.

Діагностична матриця. При практичному застосуванні методу Байєса в першу чергу складають діагностичну матрицю (таблиця 1) на основі попереднього статистичного матеріалу (апріорної інформації), в якій фіксуються значення ознак, що відповідають різним поставленим діагнозам.

Діагноз

Ознака

1

2

3

1

2

3

4

1

2

0.8

0.2

0.0

0.1

0.1

0.6

0.2

0.2

0.8

0.3

0.1

0.7

0.2

0.0

0.0

0.3

0.7

0.1

0.9

0.1

...

Процес навчання в методі Байєса полягає у формуванні саме діагностичної матриці, апріорні ймовірності діагнозів. Крім того, діагностична матриця може уточнюватись в процесі діагностики. Для цього крім значень необхідно запам’ятовувати і такі величини: – загальне число об’єктів, використаних для формування діагностичної матриці; – число об’єктів з діагнозом ; – число об’єктів з діагнозом , розпізнаних за ознакою .тоді, якщо поступає новий об’єкт з діагнозом то відбувається коректування попередніх апріорних ймовірностей діагнозів в наступний спосіб:

(19)

Далі вводяться поправки для ймовірності ознак. Наприклад, нехай в нового об’єкта з діагнозом виявлено значення . Тоді для подальшої діагностики приймаються нові значення ймовірності градацій ознаки при діагнозі :

(20)

умовні імовірності ознак при інших діагнозах коректування не потребують.

Лабораторна робота 3.3.

Розпізнавання станів системи методом Байєса.

Мета роботи. На підставі довільної апріорної інформації скласти діагностичну матрицю і знайти апостеріорні імовірності діагнозів.

Зміст роботи. Практичне застосування методу Байєса розглянемо на наступному прикладі. В системах управління з високим рівнем відповідальності крім дублювання різних контролюючих пристроїв також здійснюють контроль функціонального стану оператора спостерігача. Для цього використовують апріорну інформацію, отриману в попередніх контрольних перевірках та біжучу інформацію, отриману безпосередньо під час роботи оператора в регулярні або випадкові моменти часу. Якість роботи людини-оператора при спостереженні за засобами відображення інформації про стан системи переважно визначається двома показниками: оперативністю прийняття рішення (часом реагування на виявлену зміну параметрів системи) та кількістю допущених помилок. Відомо також що протягом роботи оператора його функціональний стан може змінюватись.

В якості діагностичних ознак переважно вибирають наступні. Нехай – перевищення витрат часу порівняно з нормою на 50 %, а – перевищення допустимого рівня помилок на 10 %. Припустимо, що для даного оператора поява цих ознак пов’язана або з втомою зорового аналізатора (стан визначений діагнозом ) або із збільшенням нервового напруження (стан визначений діагнозом ). При нормальному функціональному стані оператора (стан визначений діагнозом ) ознака не спостерігається, а ознака має місце в 5 % перевірок. На основі попередніх статистичних даних (апріорної інформації) відомо, що 80 % операторів відпрацьовують зміну в нормальному стані , 5 % операторів перебувають в стані і 15% – в стані . Відомо також, що ознака зустрічається в стані в 20 %, а в стані в 40 % випадків; ознака – в стані – 30 %, а в стані – 50 % випадків.

Складаємо за цими даними діагностичну таблицю.

Таблиця 2.

0.05

0.2

0.3

0.15

0.4

0.5

0.80

0.0

0.05

Для розв’язку поставленої задачі – визначення стану в якому перебуває оператор, знаходимо ймовірності відповідних діагнозів.

1. В процесі перевірки виявлено обидві ознаки і . Припускаючи що ознаки незалежні і застосовуючи формулу (18) знайдемо імовірність стану

.

Аналогічно отримуємо і .

2. В результаті процесу перевірки виявлено. Що перевищення витрат часу не спостерігається або є незначним – менше 3 %, тобто ознака – відсутня, але натомість має місце суттєве зростання кількості помилок – спостерігається ознака . Очевидно, що відсутність ознаки можна трактувати як присутність ознаки (протилежний стан), причому . В цьому випадку для розрахунку використовують також формулу (18), але значення імовірності з діагностичної таблиці замінюють на значення . В цьому випадку імовірність діагнозів рівна

.

Аналогічно отримуємо і .

3. У випадку, коли виявлено лише і не виявлено , тобто відсутність відповідає присутності аналогічно як і в п.2. імовірність діагнозів рівна

Аналогічно отримуємо і .

4. Обчислимо імовірності станів оператора в тому випадку, коли обидві ознаки відсутні. В результаті обчислень отримаємо

Аналогічно провівши розрахунки отримаємо значення для імовірностей і .

Таким чином, можемо зробити наступні висновки. При спостереженні ознак і оператор перебуває а стані з імовірністю , тобто має місце суттєве нервове напруження. При відсутності обох ознак найбільш імовірним є нормальний стан імовірність якого рівна . При наявності ознаки і відсутності ознаки найбільш імовірним станом є також нормальний стан . При відсутності ознаки і наявності ознаки імовірності станів і відповідно рівні і . Приблизна рівність значень імовірностей станів в цьому випадку не дає підстав прийняти правильне рішення і тому в таких ситуаціях необхідно проводити додаткові дослідження.

Хід роботи.

Для даної роботи процедура її організації складається з двох частин – теоретичного синтезу гіпотетичної ситуації та розробки програмного забезпечення контролю ситуації або системи.

1. В першій частині необхідно, розглядаючи і аналізуючи деяку реальну ситуацію в побуті, медицині на виробництві або в учбовому процесі сформувати діагностичну матрицю та можливі варіанти результатів контролю.

2. В другій частині необхідно розробити програмне забезпечення для автоматичних розрахунків імовірностей діагнозів, тобто отримуючи конкретні дані програма повинна видавати конкретне значення діагнозу або вимагати додаткової інформації.

3. З допомогою розробленого програмного забезпечення визначити ймовірності діагнозів…

СПИСОК ЛІТЕРАТУРИ

  1. Дуда Р. Харт П. Распознавание образов и анализ сцен. – М.: Мир, 1976. – 511 с.

  2. Биргер И.А. Техническая диагностика. – М.: Машиностроение, 1978. – 240 с.