- •Стохастические, линвистические методы распознавания образов иерархическая группировка
- •Содержание:
- •Распознавание самолетов
- •Вероятностный подход Введение
- •Применение
- •Байесовская процедура распознавания
- •Лабораторная работа № 6. Байесовская процедура распознавания, обеспечивающая минимальную вероятность ошибки классификации
- •Цель работы
- •Теоретические сведения
- •Задание
- •4. Порядок выполнения работы
- •5. Литература
- •Лабораторная работа №7. Байесовский классификатор в случае образов, характеризующихся нормальным распределением
- •Цель работы
- •Теоретические сведения
- •Задание
- •Порядок выполнения работы
- •5. Литература
- •Контрольные вопросы
- •Иерархическая группировка Введение
- •Определение иерархии
- •Построение иерархии
- •Пример построения иерархической группировки
- •Лабораторная работа № 8. Иерархическая группировка
- •Цель работы
- •Задание
- •Применение
- •Общее представление
- •Задание 1
- •4. Задание 2
- •5. Порядок выполнения работы
- •Литература
- •Контрольные вопросы
Определение иерархии
Пусть
X
- множество,
состоящее из т
реализаций
,
а Р
(X)
- множество
всех его частей:
.
Иерархией Н называется подмножество, удовлетворяющее следующим условиям:
,
если
,
то либо
,
либо
.
Иерархию
можно изобразить в виде дерева (см.,
например, рис. 1). Здесь
-
элементы, или вершины, иерархического
дерева;
-
терминальные элементы дерева H.
Если терминальные элементы иерархии H
содержат каждый только по одному элементу
множества X,
то они называются «атомами», а сама
иерархия – «тонкой». На практике чаще
всего используется иерархия, обозначаемая
вещественной функцией,
откладываемой вдоль оси ординат.
Эта функция может быть названа расстоянием (но в более широком смысле, потому что, вообще говоря, она никак не связана с евклидовым расстоянием между двумя точками). Выбор этого расстояния обусловливает построение иерархии.
Рассмотрим иерархическое дерево, изображенное на рис. 2. Здесь можно увидеть следующие расстояния:
расстояние
между
и
— ордината
» »
»
= »
» »
»
= »
.
Рис. 1. Пример иерархии Рис. 2. Пример иерархии с учетом
расстояния
Наша иерархия характеризуется расстоянием d. По определению, расстояние между вершинами i и j равно ординате вершины s, из которой выходят ветви, связывающие ее с i и j.
Построение иерархии
Иерархическое дерево строится с помощью ультраметрики, полученной в результате выполнения определенных алгоритмов. Один из них, предложенный Ру, базируется на обработке треугольников, либо равнобедренных, построенных на меньшей стороне как на основании, либо равносторонних.
Можно использовать также алгоритм Ланса и Вильямса, имеющий следующую структуру.
Пусть X — множество реализаций, пронумерованных от 1 до m.
1 шаг: вычислить расстояния d (i, j) в форме треугольной таблицы
2
шаг: пусть
;
удалить из таблицы все величины q,
заменить p на r,
вычислить
,
оставшихся в таблице
3 шаг: ЕСЛИ число столбцов и строк в получившейся сокращенной таблице больше 1,
ТО ИДТИ к 2,
ИНАЧЕ
КОНЕЦ.
Элементы r не являются терминальными (атомными) в иерархии. Расстояния d (i, r) можно вычислить по общей формуле
d(i,
r)=apd(i,
p) + aqd(i,
q) + bd(p, q) + c
d(i,
p)-d(i, q)
.
С помощью полученных значений коэффициентов можно построить несколько вариантов иерархий.
Простая последовательность
ар = aq = 1/2; b = 0; с = -1/2. («ближайший сосед»)
Тогда d (i, r) = inf [d (i, p), d (i, q)].
Сложная последовательность
ap = aq = 1/2; b = 0; с = 1/2. («дальний сосед»)
Тогда d (i, r) = sup [d (i, p), d (i, q)].
Средняя последовательность (Сокаль и Мишенер)
b=c=0
(групповое среднее)
Здесь
и Kq
— число атомов соответственно в каждом
элементе p
и q.
Метод центроид (Сокаль и Мишенер)
;
c=0.
Условие существования для этого алгоритма не всегда выполняется.
Метод Уорда:
;
;
.
Иерархические (деревообразные) процедуры бывают двух типов:
алгомеративные (начальным является разбиение, состоящее из одноэлементных классов, а конечным – из одного класса)
дивизимные (наоборот).
