- •1. Особенности применения и задачи кластерного анализа. Виды расстояний между объектами и их особенности.
- •2. Принципы определения расстояний между кластерами в кластерном анализе.
- •3. Иерархический алгоритм кластерного анализа и графическое представление его результатов. Метод k-средних.
- •4. Функционалы качества классификации в кластерном анализе, их виды и назначения.
- •5. Условия применения, решаемые задачи и различия кластерного и дискриминантного анализов.
- •6. Алгоритм кластер анализ типа «Форель».
6. Алгоритм кластер анализ типа «Форель».
Разработан Загоруйко и Елкиной в 1967 году в Институте математики Сибирского отделения РАН.
FOREL – (формальный элемент) является примером эвристического алгоритма классификации, основанного на идее объединения в 1 кластер объектов в области их наибольшего сгущения.
Рассмотрим алгоритм «Форель-1»
Пусть совокупность наблюдений
нужно
разбить на некоторое, заранее неизвестное
число классов. Пусть найдены вектор
средних
и
-
радиус минимальной гиперсферы с центром
в
,
содержащий все точки исследуемой
совокупности.
Зададим произвольный радиус
и
из любой точки
,
принятой за центр, радиусом R
описывается гиперсфера С1.
Находится центр тяжести
точек совокупности, попавших в гиперсферу
С1.
Из
радиусом R описывается
гиперсфера С2 и определяется
-
центр тяжести точек, попавших в С2
Процедура построения гиперсфер и
точек
повторяется
до тех пор, пока «центры тяжести», точки
не перестанут меняться. Точки совокупности,
попавшие в «стационарную» гиперсферу,
принимаются за первый класс S1.
Для всех оставшихся точек, не попавших в класс S1 процедура применяется заново и выделяется класс S2
и так далее до тех пор, пока все точки совокупности не будут распределены по классам.
Применение алгоритма «Форель-1» для ряда последовательных значений
позволяет ориентировочно оценить наиболее предпочтительное число классов для совокупности объектов.
При этом основанием для выбора числа
классов может служить многократное
повторение одного и того же числа классов
для нескольких последовательных
значений
.
Процедура алгоритма Форель является
сходящейся за конечное число шагов в
евклидовом пространстве любой размерности
при произвольном расположении точек и
любом выборе гиперсферы.
Если ставится задача разбить совокупность
на заданное число классов к, то
используется одна их модификаций
алгоритма «Форель-2», позволяющая методом
последовательного приближения находить
минимальный радиус
,
дающий разбиение на к-классов.
