Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Распознавание образов.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

2.78 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 3111 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

4.5. Иерархические процедуры

Иерархические (деревообразные) процедуры бывают двух типов: агломеративные и дивизимные. В агломеративных процедурах начальным является разбиение, состоящее из n одноэлементных классов, а конечным – из одного класса, в дивизимных наоборот. Принцип работы иерархических агломеративных (дивизимных) процедур состоит в последовательном объединении (разделении) групп элементов сначала самых близких (далеких), а затем все более отдаленных (близких) друг от друга. Большинство этих алгоритмов исходит из матрицы расстояний (сходства).

Громоздкость вычислительной реализации является недостатком иерархических процедур.

Рассмотрим пример агломеративного иерархического алгоритма. На первом шаге каждое наблюдение рассматривается как отдельный кластер. В дальнейшем на каждом шаге работы алгоритма происходит объединение двух самых близких кластеров, и, с учетом принятого расстояния, по формуле пересчитывается матрица расстояний. Размерность матрицы, очевидно, снижается на единицу. Работа алгоритма заканчивается, когда все наблюдения объединены в один класс. Иерархическую классификацию представляют в виде дендрограммы (dendron (греч.) – дерево). Дивизимные иерархические процедуры используются для распознавания образов [4].

Пример Провести классификацию n=6 объектов, каждый из которых характеризуются двумя признаками:

№ объекта i	1	2	3	4	5	6
x_i1	5	6	5	10	11	10
x_i2	10	12	13	9	9	7

Расположение объектов в виде точек на плоскости показано на рис. 4.1.

Рис. 4.1. Классификация объектов

Решение

Воспользуемся агломеративным иерархическим алгоритмом классификации. В качестве расстояния между объектами возьмем обычное евклидово расстояние. Тогда согласно формуле (4.2) расстояние между первым и вторым объектами

а между первым и третьим объектами

Очевидно, что .

Аналогично находим расстояние между шестью объектами и строим матрицу расстояний

Из матрицы расстояний следует, что четвертый и пятый объекты наиболее близки и поэтому объединяются в один кластер. После объединения объектов имеем пять кластеров:

Номер кластера	1	2	3	4	5
Состав кластера	(1)	(2)	(3)	(4,5)	(6)

Расстояние между кластерами определим по принципу «ближайшего соседа», воспользовавшись формулой пересчета (4.11). Расстояние между объектом S₁ и кластером S_(4,5) будет

Таким образом, расстояние равно расстоянию от объекта 1 до ближайшего к нему объекта, входящего в кластер S_(4,5), т.е. . Тогда матрица расстояний примет вид

Объединим второй и третий объекты, имеющие наименьшее расстояние . После объединения объектов имеем четыре кластера:

Вновь найдем матрицу расстояний. Для того чтобы рассчитать расстояние до кластера S_(2,3) воспользуемся матрицей расстояний R₂. Например, расстояние между кластерами S_(4,5₎ и S_(2,3) равно

Проведя аналогичные расчеты, получим

Объединим кластеры S₍_4,5) и S₆, расстояние между которыми, согласно матрице R₃, наименьшее . В результате получим три кластера

и .

Матрица расстояний будет иметь вид:

Объединим теперь кластеры S₍₁₎ и S_(2,3) , расстояние между которыми . В результате получим два кластера: и. S_(4,5,6) Расстояние между ними, найденное по принципу «ближайшего соседа», будет .

Результаты иерархической классификации объектов представлены на рис. 4.2 в виде дендрограммы: по горизонтали откладываются номера объектов, а по вертикали – значения мер близости, при которых происходили соединения классов.

Рис. 4.2. Дендрограмма

На рис. 4.2 приводятся расстояния между кластерами, которые объединяются на одном этапе. В этом примере предпочтение следует отдать предпоследнему этапу классификации, когда все объекты объединены в два кластера и S_(4,5,6).

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 3111 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.05.201545.57 Кб20Рабочая тетрадь по соционике.doc
#
20.05.2015219.14 Кб8Раздат. УК, т.1.doc
#
20.05.201580.38 Кб32РАЗДАТОЧНЫЙ МАТЕРИАЛ к ТЕМЕ 3.doc
#
19.03.20162.03 Mб18Разлогов_ОбзорКультПолитики.pdf
#
19.03.20161.13 Mб34Ракурсы_оЗрелищах_2011.pdf
#
01.05.20252.78 Mб8Распознавание образов.doc
#
19.03.2016388.12 Кб45Региональное страноведение Шевелева билеты.doc
#
20.05.201598.82 Кб13регистрац иностран граждан.doc
#
20.05.20152.63 Mб182Регламент пешеходный. Москва 2014 г.doc
#
20.05.2015121.88 Кб111Редакционно-издательский процесс.docx
#
19.03.2016217.09 Кб48реф.doc