
- •Міністерство освіти і науки україни національний університет “львівська політехніка”
- •Лабораторний практикум
- •“Комп’ютерні науки”
- •Методи класифікації та понижування розмірності і. Формування даних
- •1.1. Поняття класу.
- •1.2. Суть задач класифікації та понижування розмірності.
- •1.3. Типові задачі практики.
- •1.4. Типи математичних постановок задач класифікації
- •Лабораторна робота № 1.1. Формування таблиць “об’єкт – властивість”
- •2. Побудова матриць близькості
- •2.1. Гіпотеза компактності.
- •2.2. Міри подібності (близькості) кількісних та якісних ознак.
- •Побудова матриць близькості для кількісних ознак
- •Побудова матриць близькості для якісних ознак
- •Список літератури
- •Кластерний аналіз
- •3.1. Модель кластерного аналізу.
- •3.2. Кластерний аналіз.
- •Комбінаторний метод ієрархічної класифікації.
- •Ієрархічний кластерний аналіз для бінарних об’єктів.
- •Іii. Лінійні розділяючі функції і поверхні рішень.
- •1.1. Основні поняття теорії розпізнавання образів
- •1.2. Випадок двох класів.
- •1.3. Випадок багатьох класів.
- •Обчислення відстані між класами
- •Побудова розділяючої функції
- •Статистичні методи розпізнавання.
- •2.1. Основи байєсівського підходу.
- •Іv. Розпізнавання зображень
- •4.1. Поняття зображення.
- •1.2. Формалізація поняття “алгоритм розпізнавання зображень”.
- •4.3. Математична постановка задачі розпізнавання.
- •1.4. Функціональна модель процесу розпізнавання.
- •Побудова класів об’єктів з заданим типом ознак.
- •Лабораторна робота 4.2. Побудова розпізнаючого алгоритму.
Побудова матриць близькості для якісних ознак
Мета роботи. Використовуючи апріорні відомості з освіти, медицини, техніки, виробництва, сільського господарства, соціальної сфери про різні досліджувані об’єкти, розробити таблицю для експериментальних даних, представивши їх значення в порядкових або номінальних шкалах, з допомогою метрики Хеммінга побудувати матрицю близькостей (відстаней).
Зміст роботи. Якщо ознаки представляються в якісних шкалах, зокрема в шкалах найменувань та порядку, використовують відстань Хеммінга
, (7)
для
якої відмінності між об’єктами
виражаються числом неспівпадінь їх
порівнюваних ознак (властивостей). В
цьому випадку ознаки розглядаються як
бінарні, тобто такі, що можуть приймати
лише два значення “0” або “1”. Відстань
Хеммінга
є максимальною і рівна 1 для об’єктів
з протилежними за значеннями описами,
тобто елементи одного опису є протилежними
до відповідних елементів опису другого
об’єкту.
Для об’єктів, всі ознаки яких(з числа
включених в опис) співпадають,
.
Приклад. Порівняємо три обєкти: вишню, яблуню і банан за трьома ознаками : кольором, наявністю насіння і кісточок. Якщо об’єкт має дану ознаку (властивість) то їй приписуться значення “1”, а в протилежному випадку – “0”. Значення ознак приведені в таблиці 2.
Таблиця 2.
-
Об’єкт
Колір
Насіння
кісточки
Жовтий
Червоний
(вишня)
0
1
0
1
(яблуко)
1
1
1
0
(банан)
1
0
0
0
тоді,
у
відповідності
з
(7) маємо
,
і
.
Отже в прийнятих описах яблуко і банан
більш подібні одне з одним ніж з вишнею.
Хід роботи.
1. На підставі апріорних знань з освіти, медицини, техніки, виробництва, сільського господарства, соціальної сфери про різні реальні об’єкти, явища або ситуації вибрати декілька об’єктів, які характеризуються декількома ознаками.
2. Для вибраних об’єктів (кількість ознак не обов’язково повинна бути однаковою) розробити таблицю «об’єкт – властивість», тобто представити отримані гіпотетичні дані у формі таблиці, аналогічній до таблиці 2.
3. Розробити програмене забезпечення і для представлених, в такий спосіб, даних з допомогою метрики Хеммінга побудувати матрицю близькостей (відстаней).
4. Результати роботи оформити у вигляді розширеного звіту, з докладним обґрунтуванням і описом об’єктів та їх властивостей. Привести зразок алгоритму розрахунку параметрів матриці близькостей та чітко сформулювати висновки та рекомендації для використання даної методики.
Список літератури
Компанец Л.Ф. Математическое обеспечение …
Статистические метод…
Елисеева И.И., Рукавишников В.О. Группировка, корреляция, распознавание образов.