- •Міністерство освіти і науки україни національний університет “львівська політехніка”
- •Лабораторний практикум
- •“Комп’ютерні науки”
- •Методи класифікації та понижування розмірності і. Формування даних
- •1.1. Поняття класу.
- •1.2. Суть задач класифікації та понижування розмірності.
- •1.3. Типові задачі практики.
- •1.4. Типи математичних постановок задач класифікації
- •Лабораторна робота № 1.1. Формування таблиць “об’єкт – властивість”
- •2. Побудова матриць близькості
- •2.1. Гіпотеза компактності.
- •2.2. Міри подібності (близькості) кількісних та якісних ознак.
- •Побудова матриць близькості для кількісних ознак
- •Побудова матриць близькості для якісних ознак
- •Список літератури
- •Кластерний аналіз
- •3.1. Модель кластерного аналізу.
- •3.2. Кластерний аналіз.
- •Комбінаторний метод ієрархічної класифікації.
- •Ієрархічний кластерний аналіз для бінарних об’єктів.
- •Іii. Лінійні розділяючі функції і поверхні рішень.
- •1.1. Основні поняття теорії розпізнавання образів
- •1.2. Випадок двох класів.
- •1.3. Випадок багатьох класів.
- •Обчислення відстані між класами
- •Побудова розділяючої функції
- •Статистичні методи розпізнавання.
- •2.1. Основи байєсівського підходу.
- •Іv. Розпізнавання зображень
- •4.1. Поняття зображення.
- •1.2. Формалізація поняття “алгоритм розпізнавання зображень”.
- •4.3. Математична постановка задачі розпізнавання.
- •1.4. Функціональна модель процесу розпізнавання.
- •Побудова класів об’єктів з заданим типом ознак.
- •Лабораторна робота 4.2. Побудова розпізнаючого алгоритму.
Статистичні методи розпізнавання.
2.1. Основи байєсівського підходу.
Основна перевага статистичних методів розпізнавання полягає в тому, що є можливість одночасного врахування ознак різної фізичної природи, оскільки вони характеризуються безрозмірними величинами – ймовірностями їх появи при різних станах системи. Серед методів розпізнавання метод оснований на узагальненій формулі Байєса незважаючи на свою простоту є досить ефективним. До недоліків цього методу відносять: необхідність великих обсягів (статистично достатніх) попередньої інформації та низька чутливість до варіантів рішень, які є рідкісними подіями. Проте у випадках, коли обсяг статистичних даних дозволяє застосувати метод Байєса, його доцільно використовувати як один з найбільш надійних і ефективних методів.
Суть
методу полягає в наступному. Нехай в
результаті контролю працездатності
системи, який полягає в розпізнаванні
функціональних станів цієї системи
виявлено деяку ознаку
,
де
– множина ознак, і на цій підставі
прийнято варіант рішення, тобто поставлено
діагноз
,
де
– множина варіантів діагнозів. Імовірність
сумісної появи подій – розпізнано
ознаку
і поставлено діагноз
– може бути визначена як
. (12)
Тоді,
імовірність
– постановка даного діагнозу при
розпізнаванні ознаки
визначається з співвідношення
. (13)
Співвідношення (13) називають формулою Байєса. Для користування цією формулою дуже важливо визначити точний смисл усіх величин, які в неї входять.
– імовірність діагнозу
,
яка визначається на основі статистичних
даних (апріорна
імовірність рішення).
Наприклад, якщо попередньо досліджено
об’єктів
і для
об’єктів
було прийнято рішення
,
то
.
– імовірність появи ознаки
в об’єктів,
для яких було прийнято рішення
,
тобто, якщо серед
об’єктів,
для яких прийнято рішення
,
ознака
,
виявлена у
об’єктів,
то
.
– імовірність появи ознаки
у всіх об’єктів
незалежно від того чи було прийняте
рішення
чи ні, тобто якщо з загального числа
об’єктів
ознака
була виявлена в
об’єктів,
то
.
Для прийняття рішення спеціальне
обчислення імовірності
не потрібне, оскільки відомі для усіх
можливих станів значення
і
визначають величину
.
– імовірність прийняття рішення
після того як стало відомо про наявність
в розпізнаваного об’єкта ознаки
(апостеріорна
імовірність рішення).
Якщо
розпізнавання здійснюється на підставі
комплексу ознак
,
причому кожна ознака може бути представлена
декількома градаціями
.
Такий комплекс ознак є фактично
формалізованим описом еталону, з
допомогою якого здійснюють ідентифікацію
знайдених, подібних до нього об’єктів,
і які відповідають рішенням стосовно
вибраного діагнозу
.
В
результаті розпізнавання об’єктів,
явищ, ситуацій стають відомими значення
реалізацій кожної з виявлених і
розпізнаних ознак
,
а отже і всього комплексу
.
Формула Байєса для комплексу ознак має
вид
, (14)
де
– імовірність рішення, на підставі
якого ставиться діагноз
,
після того, як стали відомі результати
розпізнавання за набором ознак
,
а
–попередня ймовірність рішення
(на основі попередньої статистики).
Якщо
кількість ознак в комплексі
,
то значення ймовірності
визначають з допомогою співвідношень:
у випадку залежних ознак
,
(15)
або у випадку незалежних ознак
. (16)
При великій кількості ознак в більшості практичних задач можна припустити незалежність ознак навіть при істотних кореляційних зв’язках між ними.
Імовірність розпізнавання комплексу ознак рівна
. (17)
Тоді, враховуючи (15) узагальнена формула Байєса матиме вид
, (18)
де
може бути визначена з допомогою (15) або
(16). Очевидно, що має мати місце умова
.
Оскільки один з діагнозів обов’язково
реалізується, а реалізація одночасно
двох і більше неможлива.
Діагностична матриця. При практичному застосуванні методу Байєса в першу чергу складають діагностичну матрицю (таблиця 1) на основі попереднього статистичного матеріалу (апріорної інформації), в якій фіксуються значення ознак, що відповідають різним поставленим діагнозам.
-
Діагноз
Ознака
1
2
3
1
2
3
4
1
2
0.8
0.2
0.0
0.1
0.1
0.6
0.2
0.2
0.8
0.3
0.1
0.7
0.2
0.0
0.0
0.3
0.7
0.1
0.9
0.1
...
Процес
навчання в методі Байєса полягає у
формуванні саме діагностичної матриці,
апріорні ймовірності діагнозів. Крім
того, діагностична матриця може
уточнюватись в процесі діагностики.
Для цього крім значень
необхідно запам’ятовувати і такі
величини:
– загальне число об’єктів, використаних
для формування діагностичної матриці;
– число об’єктів з діагнозом
;
– число об’єктів з діагнозом
,
розпізнаних за ознакою
.тоді,
якщо поступає новий об’єкт з діагнозом
то відбувається коректування попередніх
апріорних ймовірностей діагнозів в
наступний спосіб:
(19)
Далі
вводяться поправки для ймовірності
ознак. Наприклад, нехай в нового об’єкта
з діагнозом
виявлено значення
.
Тоді для подальшої діагностики приймаються
нові значення ймовірності градацій
ознаки
при діагнозі
:
(20)
умовні імовірності ознак при інших діагнозах коректування не потребують.
Лабораторна робота 3.3.
Розпізнавання станів системи методом Байєса.
Мета роботи. На підставі довільної апріорної інформації скласти діагностичну матрицю і знайти апостеріорні імовірності діагнозів.
Зміст роботи. Практичне застосування методу Байєса розглянемо на наступному прикладі. В системах управління з високим рівнем відповідальності крім дублювання різних контролюючих пристроїв також здійснюють контроль функціонального стану оператора спостерігача. Для цього використовують апріорну інформацію, отриману в попередніх контрольних перевірках та біжучу інформацію, отриману безпосередньо під час роботи оператора в регулярні або випадкові моменти часу. Якість роботи людини-оператора при спостереженні за засобами відображення інформації про стан системи переважно визначається двома показниками: оперативністю прийняття рішення (часом реагування на виявлену зміну параметрів системи) та кількістю допущених помилок. Відомо також що протягом роботи оператора його функціональний стан може змінюватись.
В
якості діагностичних ознак переважно
вибирають наступні. Нехай
– перевищення витрат часу порівняно з
нормою на 50 %, а
– перевищення допустимого рівня помилок
на 10 %. Припустимо, що для даного оператора
поява цих ознак пов’язана або з втомою
зорового аналізатора (стан визначений
діагнозом
)
або із збільшенням нервового напруження
(стан визначений діагнозом
).
При нормальному функціональному стані
оператора (стан визначений діагнозом
)
ознака
не спостерігається, а ознака
має місце в 5 % перевірок. На основі
попередніх статистичних даних (апріорної
інформації) відомо, що 80 % операторів
відпрацьовують зміну в нормальному
стані
,
5 % операторів перебувають в стані
і 15% – в стані
.
Відомо також, що ознака
зустрічається в стані
в 20 %, а в стані
в 40 % випадків; ознака
– в стані
– 30 %, а в стані
– 50 % випадків.
Складаємо за цими даними діагностичну таблицю.
Таблиця 2.
-
0.05
0.2
0.3
0.15
0.4
0.5
0.80
0.0
0.05
Для розв’язку поставленої задачі – визначення стану в якому перебуває оператор, знаходимо ймовірності відповідних діагнозів.
1. В процесі перевірки виявлено обидві ознаки і . Припускаючи що ознаки незалежні і застосовуючи формулу (18) знайдемо імовірність стану
.
Аналогічно
отримуємо
і
.
2.
В результаті процесу перевірки виявлено.
Що перевищення витрат часу не
спостерігається або є незначним – менше
3 %, тобто ознака
– відсутня, але натомість має місце
суттєве зростання кількості помилок
– спостерігається ознака
.
Очевидно, що відсутність ознаки
можна трактувати як присутність ознаки
(протилежний стан), причому
.
В цьому випадку для розрахунку
використовують також формулу (18), але
значення імовірності
з діагностичної таблиці замінюють на
значення
.
В цьому випадку імовірність діагнозів
рівна
.
Аналогічно
отримуємо
і
.
3.
У випадку, коли виявлено лише
і не виявлено
,
тобто відсутність
відповідає присутності
аналогічно як і в п.2.
імовірність діагнозів рівна
Аналогічно
отримуємо
і
.
4. Обчислимо імовірності станів оператора в тому випадку, коли обидві ознаки відсутні. В результаті обчислень отримаємо
Аналогічно
провівши розрахунки отримаємо значення
для імовірностей
і
.
Таким чином, можемо зробити наступні висновки. При спостереженні ознак і оператор перебуває а стані з імовірністю , тобто має місце суттєве нервове напруження. При відсутності обох ознак найбільш імовірним є нормальний стан імовірність якого рівна . При наявності ознаки і відсутності ознаки найбільш імовірним станом є також нормальний стан . При відсутності ознаки і наявності ознаки імовірності станів і відповідно рівні і . Приблизна рівність значень імовірностей станів в цьому випадку не дає підстав прийняти правильне рішення і тому в таких ситуаціях необхідно проводити додаткові дослідження.
Хід роботи.
Для даної роботи процедура її організації складається з двох частин – теоретичного синтезу гіпотетичної ситуації та розробки програмного забезпечення контролю ситуації або системи.
1. В першій частині необхідно, розглядаючи і аналізуючи деяку реальну ситуацію в побуті, медицині на виробництві або в учбовому процесі сформувати діагностичну матрицю та можливі варіанти результатів контролю.
2. В другій частині необхідно розробити програмне забезпечення для автоматичних розрахунків імовірностей діагнозів, тобто отримуючи конкретні дані програма повинна видавати конкретне значення діагнозу або вимагати додаткової інформації.
3. З допомогою розробленого програмного забезпечення визначити ймовірності діагнозів…
СПИСОК ЛІТЕРАТУРИ
Дуда Р. Харт П. Распознавание образов и анализ сцен. – М.: Мир, 1976. – 511 с.
Биргер И.А. Техническая диагностика. – М.: Машиностроение, 1978. – 240 с.
