Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры_ИСУ (2).doc
Скачиваний:
4
Добавлен:
01.05.2025
Размер:
6.53 Mб
Скачать

18. Алгоритм нечеткой кластеризации с-средних

Резонно предположить, что точки данных, расположенные в средней части на рис. 5 между двумя центрами кластеров, принадлежат к обоим кластерам с разной степенью членства. Алгоритм нечетких с-средних значений (НСС) допускает, что каждая точка данных принадлежит кластеру в некоторой степени, называемой степенью принадлежности, и отсюда каждая точка данных может принадлежать не одному, а нескольким различным кластерам с той или иной степенью. При этом предположение о том, что ={0,1} для жесткой кластеризации смягчается до предположения =[0,1], т.е. до предположения о том, что степень принадлежности может принимать любые значения, лежащие между нулем и единицей. В этом случае интерпретируется как степень принадлежности вектора данных xj к кластеру i. Особенно тогда, когда существуют неоднозначные данные, т.е. данные, которые можно отнести к нескольким кластерам, и когда границы кластеров являются размытыми, степень принадлежности более реалистична, чем четкие приписывания 0 (нуля) или 1(единицы). Однако, оказывается, что минимум целевой функции (10) при двух последних ограничениях (11) получается тем же самым, когда выбрано как в алгоритме жестких с – средних, т.е. как ={0,1}, несмотря на то, мы допускаем =[0,1]. Поэтому дополнительный параметр m, так называемый фаззификатор, вводится в целевую функцию (10) и она принимает следующий вид . (16). Заметим, что фаззификатор m не играет никакой роли, если мы не отходим от жесткой кластеризации, т.е. если m=1. Фаззификатор m >1 не является субъектом оптимизационного процесса и должен быть выбран заранее. Типичный выбор m =2. Мы коснемся влияния фаззификатора после постановки задачи нечеткой кластеризации. Метод нечеткой кластеризации с целевой функцией (16) при выполнении двух последних условий, входящих в (11a), и при допущении =[0,1] называется вероятностной кластеризацией, т.к. в соответствии с ограничением (11a) степень принадлежности можно интерпретировать как вероятность того, что xj принадлежит к кластеру i.

(11a).При этом задача минимизации (16) остается нелинейной оптимизационной задачей, однако, со всеми непрерывными параметрами в отличие от жесткой кластеризации. Общая технология минимизации целевой функции аналогична технологии, применяемой при жесткой кластеризации, а именно, альтернативная (чередующаяся) оптимизация или степеней принадлежности или параметров центра кластера, принимая во внимание, что другое множество параметров фиксировано. Вводя в рассмотрение множители Лагранжа с целью свести условную задачу оптимизации к безусловной задаче оптимизации, минимум целевой функции (16) относительно степеней принадлежности получаем в виде , (17) если параметры кластеров, т.е., если значения прототипов, следовательно, величины расстояний рассматриваются как фиксированные. Если =0 для одного или более кластеров, мы отходим от (17) и приписываем xj со степенью 1 к одному или нескольким кластерам с =0, и полагаем =0 для другого кластера (других кластеров) i. Если кластеры представлены простыми прототипами (центрами) и расстояния являются евклидовыми расстояниями между данными и соответствующими кластерными прототипами как в жестком алгоритме с – средних значений, минимум целевой функции (16) относительно кластерных прототипов имеет место при

, (18)когда степени принадлежности рассматриваются как фиксированные. Прототипы остаются все еще центрами кластеров. Однако, использование степеней принадлежности, принадлежащих интервалу [0,1], означает, что мы должны вычислять взвешенные центры кластеров. Нечеткая процедура кластеризации, которая использует поочередно (альтернативно) (17) и (18) называется алгоритмом нечетких с-средних значений. Разделенные кластеры в этом алгоритме, как правило, определяют с помощью бинарной характеристической матрицы

, (19)

называемой матрицей принадлежности (нечеткого разделения), элементами которой являются степени принадлежности для всех i=1, 2,…, c и j =1, 2, …, K..

Алгоритм. При вычислениях в групповом варианте (в пакетном режиме) алгоритм нечетких с-средних со всеми непрерывными параметрами определяет центры кластеров и матрицу принадлежности M, используя следующие шаги.

1.Инициирует матрицу нечеткого разделения M со случайными элементами, расположенными между нулем и единицей в рамках ограничения (11a).

2.Вычисляет с центров кластеров (i=1,2,…,c), используя (18) .

3.Вычисляет целевую функцию в соответствии с (16) . Алгоритм прекращает свою работу или если целевая функция становится меньше допустимого значения или если ее изменение по сравнению с предыдущей итерацией ниже некоторого порогового значения.

4.Вычисляет новое значение матрицы M, используя (17) .

5.Переходит к шагу 2.

Альтернативно вначале могут быть инициированы центры кластеров еще до перехода к итерационной процедуре. Алгоритм может не сходиться к оптимальному решению, и полученный результат зависит от начальных значений центров кластеров, впрочем, также как в случае применения алгоритма жестких с-средних.