КОНСПЕКТ ЛЕКЦИЙ КОДЭИ
.pdf3.Для каждой записи исходной выборки определяется ближайший к ней центр кластера.
4.Производится вычисление центроидов — центров тяжести кластеров. с*то делается путем определения среднего для значений каждого признака всех записей в кластере.
Например, если в кластер вошли три записи с наборами
признаков (x1, y1), (x2, y2), (x3, y3), то координаты его центроида будут рассчитываться следующим образом:
(x, y) = ((x1 + x2 + x3)/3, (y1 + y2 + y3)/3).
Затем старый центр кластера смещается в его центроид.
12.03.13 Доцент С.Т. Касюк |
13 |
Шаги 3 и 4 повторяются до тех нор, пока выполнение алгоритма не будет прервано либо пока не будет выполнено условие в соответствии с некоторым критерием сходимости.
Остановка алгоритма производится, когда границы кластеров и расположение центроидов перестают изменяться, то есть на каждой итерации в каждом кластере остается один и тот же набор записей.
Алгоритм k-means обычно находит набор стабильных кластеров за несколько десятков итераций.
12.03.13 Доцент С.Т. Касюк |
14 |
12.03.13 Доцент С.Т. Касюк |
15 |
12.03.13 Доцент С.Т. Касюк |
16 |
12.03.13 Доцент С.Т. Касюк |
17 |
12.03.13 Доцент С.Т. Касюк |
18 |
12.03.13 Доцент С.Т. Касюк |
19 |
12.03.13 Доцент С.Т. Касюк |
20 |
В STATISTICA реализованы следующие методы кластеризации — агломеративные методы: joining (tree clustering), twoway joining, а также метод k- средних — k-means clastering.
12.03.13 Доцент С.Т. Касюк |
21 |
В STATISTICA можно выбрать следующие правила иерархического объединения кластеров:
Single linkage — метод одиночной связи; Complete linkage — метод полной связи;
Unweighted pair group average — невзвешенный метод
«средней связи»;
Weighted pair group average — взвешенный метод
«средней связи»;
Weighted centroid pair group (median) — взвешенный центроидный метод;
Ward method — метод Уорда.
12.03.13 Доцент С.Т. Касюк |
22 |