Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
метод_указания_2.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
493.06 Кб
Скачать

Определение иерархии

Пусть X - множество, состоящее из т реализаций , а Р (X) - множество всех его частей:

.

Иерархией Н называется подмножество, удовлетворяющее следующим условиям:

, если , то либо , либо .

Иерархию можно изобразить в виде дерева (см., например, рис. 1). Здесь - элементы, или вершины, иерархического дерева; - терминальные элементы дерева H. Если терминальные элементы иерархии H содержат каждый только по одному элементу множества X, то они называются «атомами», а сама иерархия – «тонкой». На практике чаще всего используется иерархия, обозначаемая вещественной функцией, откладываемой вдоль оси ординат.

Эта функция может быть названа расстоянием (но в более широком смысле, потому что, вообще говоря, она никак не связана с евкли­довым расстоянием между двумя точками). Выбор этого расстояния обусловливает построение иерархии.

Рассмотрим иерархическое дерево, изображенное на рис. 2. Здесь можно увидеть следующие расстояния:

расстояние между и ордината

» » » = »

» » » = » .

Рис. 1. Пример иерархии Рис. 2. Пример иерархии с учетом

расстояния

Наша иерархия характеризуется расстоянием d. По определе­нию, расстояние между вершинами i и j равно ординате вершины s, из которой выходят ветви, связывающие ее с i и j.

Построение иерархии

Иерархическое дерево строится с помощью ультраметрики, полученной в результате выполнения определенных алгоритмов. Один из них, предложенный Ру, базируется на обработке треугольников, либо равнобедренных, построенных на меньшей стороне как на основании, либо равносторонних.

Можно использовать также алгоритм Ланса и Вильямса, имеющий следующую структуру.

Пусть X — множество реализаций, пронумерованных от 1 до m.

1 шаг: вычислить расстояния d (i, j) в форме треугольной таблицы

2 шаг: пусть ;

удалить из таблицы все величины q,

заменить p на r,

вычислить , оставшихся в таблице

3 шаг: ЕСЛИ число столбцов и строк в получившейся сокращенной таблице больше 1,

ТО ИДТИ к 2,

ИНАЧЕ

КОНЕЦ.

Элементы r не являются терминальными (атомными) в иерар­хии. Расстояния d (i, r) можно вычислить по общей формуле

d(i, r)=apd(i, p) + aqd(i, q) + bd(p, q) + c d(i, p)-d(i, q) .

С помощью полученных значений коэффициентов можно по­строить несколько вариантов иерархий.

Простая последовательность

ар = aq = 1/2; b = 0; с = -1/2. («ближайший сосед»)

Тогда d (i, r) = inf [d (i, p), d (i, q)].

Сложная последовательность

ap = aq = 1/2; b = 0; с = 1/2. («дальний сосед»)

Тогда d (i, r) = sup [d (i, p), d (i, q)].

Средняя последовательность (Сокаль и Мишенер)

b=c=0 (групповое среднее)

Здесь и Kq — число атомов соответственно в каждом элементе p и q.

Метод центроид (Сокаль и Мишенер)

; c=0.

Условие существования для этого алгоритма не всегда выполняется.

Метод Уорда:

; ; .

Иерархические (деревообразные) процедуры бывают двух типов:

  • алгомеративные (начальным является разбиение, состоящее из одноэлементных классов, а конечным – из одного класса)

  • дивизимные (наоборот).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]