Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

КОНСПЕКТ ЛЕКЦИЙ КОДЭИ

.pdf
Скачиваний:
110
Добавлен:
14.03.2016
Размер:
28.31 Mб
Скачать

3.Для каждой записи исходной выборки определяется ближайший к ней центр кластера.

4.Производится вычисление центроидов — центров тяжести кластеров. с*то делается путем определения среднего для значений каждого признака всех записей в кластере.

Например, если в кластер вошли три записи с наборами

признаков (x1, y1), (x2, y2), (x3, y3), то координаты его центроида будут рассчитываться следующим образом:

(x, y) = ((x1 + x2 + x3)/3, (y1 + y2 + y3)/3).

Затем старый центр кластера смещается в его центроид.

12.03.13 Доцент С.Т. Касюк

13

Шаги 3 и 4 повторяются до тех нор, пока выполнение алгоритма не будет прервано либо пока не будет выполнено условие в соответствии с некоторым критерием сходимости.

Остановка алгоритма производится, когда границы кластеров и расположение центроидов перестают изменяться, то есть на каждой итерации в каждом кластере остается один и тот же набор записей.

Алгоритм k-means обычно находит набор стабильных кластеров за несколько десятков итераций.

12.03.13 Доцент С.Т. Касюк

14

12.03.13 Доцент С.Т. Касюк

15

12.03.13 Доцент С.Т. Касюк

16

12.03.13 Доцент С.Т. Касюк

17

12.03.13 Доцент С.Т. Касюк

18

12.03.13 Доцент С.Т. Касюк

19

12.03.13 Доцент С.Т. Касюк

20

В STATISTICA реализованы следующие методы кластеризации — агломеративные методы: joining (tree clustering), twoway joining, а также метод k- средних — k-means clastering.

12.03.13 Доцент С.Т. Касюк

21

В STATISTICA можно выбрать следующие правила иерархического объединения кластеров:

Single linkage — метод одиночной связи; Complete linkage — метод полной связи;

Unweighted pair group average — невзвешенный метод

«средней связи»;

Weighted pair group average — взвешенный метод

«средней связи»;

Weighted centroid pair group (median) — взвешенный центроидный метод;

Ward method — метод Уорда.

12.03.13 Доцент С.Т. Касюк

22