
- •Міністерство освіти і науки україни національний університет “львівська політехніка”
- •Лабораторний практикум
- •“Комп’ютерні науки”
- •Методи класифікації та понижування розмірності і. Формування даних
- •1.1. Поняття класу.
- •1.2. Суть задач класифікації та понижування розмірності.
- •1.3. Типові задачі практики.
- •1.4. Типи математичних постановок задач класифікації
- •Лабораторна робота № 1.1. Формування таблиць “об’єкт – властивість”
- •2. Побудова матриць близькості
- •2.1. Гіпотеза компактності.
- •2.2. Міри подібності (близькості) кількісних та якісних ознак.
- •Побудова матриць близькості для кількісних ознак
- •Побудова матриць близькості для якісних ознак
- •Список літератури
- •Кластерний аналіз
- •3.1. Модель кластерного аналізу.
- •3.2. Кластерний аналіз.
- •Комбінаторний метод ієрархічної класифікації.
- •Ієрархічний кластерний аналіз для бінарних об’єктів.
- •Іii. Лінійні розділяючі функції і поверхні рішень.
- •1.1. Основні поняття теорії розпізнавання образів
- •1.2. Випадок двох класів.
- •1.3. Випадок багатьох класів.
- •Обчислення відстані між класами
- •Побудова розділяючої функції
- •Статистичні методи розпізнавання.
- •2.1. Основи байєсівського підходу.
- •Іv. Розпізнавання зображень
- •4.1. Поняття зображення.
- •1.2. Формалізація поняття “алгоритм розпізнавання зображень”.
- •4.3. Математична постановка задачі розпізнавання.
- •1.4. Функціональна модель процесу розпізнавання.
- •Побудова класів об’єктів з заданим типом ознак.
- •Лабораторна робота 4.2. Побудова розпізнаючого алгоритму.
1.3. Випадок багатьох класів.
Існують
різні способи створення класифікаторів
для багатьох класів, основаних на
використанні лінійних розділяючих
функцій. Наприклад, можна звести задачу
до
задачі для двох класів, де розв’язком
-ої
задачі є лінійна розділяюча функція,
яка визначає границю між точками, які
відповідають рішенню
,
і точками, які не відповідають рішенню
.
При іншому підході можна використати
лінійних розділяючих функцій, по одній
для кожної пари класів.
a
б
Рис. 2. Лінійні границі областей рішень для задачі трьох класів
a
– дихотомія
,
b
– дихотомія
.
На рис. 2 показано, що обидва ці підходи можуть привести до областей, які зображені заштрихованими, тобто областей в яких класифікація є невизначеною.
Лабораторна робота 3.1.
Обчислення відстані між класами
Мета роботи: Розробити програму і представити візуально експериментальні дані – значення відстаней між трьома кластерами, представленими точками.
Суть роботи. Для алгоритмів розпізнавання образів велике значення має обчислення відстані між класами (образами), причому найбільш часто використовуються між класові відстані за принципами найближчого сусіда, центра ваги (або подібного до нього середнього зв’язку) та найдальшого сусіда.
Відстані найближчого та найдальшого сусіда є відстань між найближчими і найдальшими об’єктами сусідніх класів, як показано на рис.3.
Рис.3. Відстань між класами за принципом найближчого та найдальшого сусіда.
Поняття
центра ваги визначається як значення
координат центра ваги системи точок
,
кожна з яких має масу
(5)
В цьому випадку центри ваг класів не обов’язково повинні співпадати з якоюсь з точок. Рис. 2. є ілюстрацією цієї відстані.
Рис. 4. Відстань між центрами ваг.
Хід роботи.
1. Використовуючи внутрішній генератор випадкових чисел RND програмного забезпечення будь-якої мови програмування необхідно побудувати локалізовані в межах області екрану три довільної форми кластери – групи точок, які відображають класи об’єктів з двомірними характеристиками, так щоб найбільша відстань між об’єктами всередині одного класу була меншою від відстані між найближчими об’єктами сусідніх класів. Розподіл об’єктів у групі може бути якої завгодно конфігурації з різною кількістю точок, але не більше 20 для кожного кластера. Кластери слід виділити окремими кольорами.
2. Використовуючи принцип розгортки розробити алгоритм і програмно його реалізувати з допомогою відповідних логічних предикатів. Суть логічного предикату полягає в конструюванні логічної умови IF – THEN – ELSE відносно кожної точки конкретного кластера, враховуючи її колір. З допомогою цього алгоритму визначити відстані між :
найближчими сусідами;
між центрами кластерів;
найдальшими сусідами;
та знайти габаритні межі кожного кластера.
3. Визначені значення відстаней, позначити відповідними лініями. Результати проведених досліджень занести в таблицю
Таблиця 1.
Назвa класу |
Габарити класу |
Відстані |
||||||||
Найближчого сусіда |
Між центрами кластерів |
Найдальшого сусіда |
||||||||
АB |
ВС |
АС |
АВ |
ВС |
АС |
АВ |
ВС |
АС |
||
А |
|
|
|
|
|
|
|
|
|
|
В |
|
|
|
|
|
|
|
|
|
|
С |
|
|
|
|
|
|
|
|
|
|
4. Оформити звіт і представити роботу до захисту.
Лабораторна робота 3.2.