Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции по нейроинформатике.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

9.7 Mб

Скачать

☆

<<< < Предыдущая 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2122 / 3122 23 24 25 26 27 28 29 30 31 > Следующая >>>

Алгоритмы кластеризации

В настоящее время существует довольно большое число алгоритмов кластеризации, которые можно использовать для нахождения кластерных центров.

Основная идея кластерных алгоритмов – разделение входного пространства на группы. При этом сходство векторов внутри группы должно быть больше сходства с векторами других групп. Для реализации этой идеи вводятся метрики схожести. Большинство из них чувствительны к интервалу изменения входных переменных, поэтому входные переменные нормализуются и приводятся к единичному интервалу.

Пороговый алгоритм

Дано:

множество точек во входном пространстве X

;

пороговая величина Т, определяет критерий принадлежности точки какому-

либо классу (кластеру).

Данный алгоритм сводится к следующей последовательности действий:

Выбираем случайным образом точку, соответствующую центру первого кластера. (z₁)
Из множества точек входного пространства X выбираем произвольную точку x_i и вычисляем расстояние от данной точки до центра первого кластера z₁. ( )
Если выполняется неравенство , то точка x_i принадлежит кластеру с центром z₁. В противном случае, создаётся новый кластер с центром z₂= x_i.
Пункты 2 и 3 циклически повторяются для всех точек множества X.

Если точки множества X расположены на значительном расстоянии друг от друга, то в результате работы данного алгоритма для каждой точки будет создан свой кластер.

Недостаток алгоритма: Эффективность алгоритма во многом определяется величиной

пороговой величины Т и зависит от порядка просмотра точек множества X.

Алгоритм максимального расстояния

Характерная особенность алгоритма – выбор наиболее удалённых кластеров.

Дано:

множество точек во входном пространстве X

Данный алгоритм сводится к следующей последовательности действий:

Выбираем случайным образом точку, соответствующую центру первого кластера. (z₁)
Из множества точек X выбираем такую точку, которая наиболее удалена от точки, соответствующей центру z₁, и определяем эту точку как центр второго кластера.

Для каждой из точек вычисляются расстояния от данной точки до всех центров кластеров , созданных на данный момент времени.

То есть для каждой точки x_j множества X определяется кластер («свой» кластер), расстояние до которого будет минимальным. Далее выбирается точка x^*, наиболее удалённая от данного («своего») кластера.

На каждом шаге алгоритма t=1,2,3,…вычисляется величина:

Если значение d составляет существенную часть (не менее половины) от величины , то тогда x^* объявляется центром нового кластера. В противном случае (значение d менее половины от величины ) процесс завершается, а все оставшиеся точки множества X разносятся по ближайшим кластерам.

Недостатки алгоритма:

случайный выбор начального кластера
увеличение уровня сложности на каждом шаге работы алгоритма

<<< < Предыдущая 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2122 / 3122 23 24 25 26 27 28 29 30 31 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20251.77 Mб1Лекции по моделированию.doc
#
03.11.2018401.41 Кб21Лекции по начертательной геометрии.doc
#
09.02.20151.63 Mб56Лекции по начертательной геометрии.doc
#
10.02.20152.8 Mб2091Лекции по начертательной геометрии.pdf
#
01.07.202513.46 Mб0Лекции по НГ ИУ.doc
#
01.05.20259.7 Mб3Лекции по нейроинформатике.doc
#
01.05.20251.02 Mб3Лекции по оп. исчислению.docx
#
23.09.2019851.97 Кб15Лекции по ПА и ПО (с пояснениями).doc
#
31.08.20191.2 Mб221Лекции по патологической анатомии.doc
#
01.07.202598.19 Кб0Лекции по ПЛР.docx
#
01.05.2025424.24 Кб0Лекции по СИИ.docx

Алгоритмы кластеризации

Пороговый алгоритм

Алгоритм максимального расстояния