Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Стат. обр. 4195-96. 2014 / Конспект лекции 5.Кластерный анализ.docx
Скачиваний:
237
Добавлен:
12.03.2015
Размер:
231.56 Кб
Скачать

Пример 5.6. Кластерный анализ. Расстояние Хемминга. Ближайший сосед

Требуется разделить шесть объектов на два кластера. Объекты –

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 19.31.

Таблица 19.31

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Хемминга по двум признакам. Проведение вычислений для второго и пятого объектов пояснено рис.5.6.1 и для второго и шестого объектов рис.5.6.2

10 Х2

8

6

4

d15 =|2-14|+|8-6|=14

2

2 4 6 8 10 12 14 Х1

Рис.5.6.1

10 Х2

8

6

4

2 d26 =|4-15|+|10-4|=17

2 4 6 8 10 12 14 Х1

Рис.5.6.2

Таблица 19.32

1

2

3

4

5

6

1

0

4

4

12

14

17

2

0

4

12

14

17

3

0

8

10

13

4

0

2,00

5

5

0

3

6

0

1

2

3

4,5

6

1

0

4

4

12

17

2

0

4

12

17

3

0

8

13

4,5

0

3

6

0


Жирным шрифтом в таблице 19.32 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены

по правилу «ближайшего соседа» и представлены в таблице 19.33.

Таблица 19.33

Далее процесс выделения объектов в кластеры производится аналогично ранее рассмотренным методам. По таблице 19.33 находим минимальное расстояние между объектом, включающим в себя 4 и 5 объекты, и 6 объектом, которые объединяем в объект 4,5,6 и составляем таблицу 19.34.

Таблица 19.34

1

2

3

4,5,6

1

0

4

4

12

2

0

4

12

3

0

8

4,5,6

0

Ввиду того, что расстояния между 1,2 и 3 объектами одинаковые и минимальные, то вначале объединяем 1 и 2 объекты и результаты такого объединения помещаем в таблицу 19.35. Затем к ним присоединяем 3 объект и результаты объединения помещаем в таблицу 19.36.

Таблица 19.35

1,2

3

4,5,6

1,2

0

4

12

3

0

8

4,5,6

0


Таблица 19.36

1,2,3

4,5,6

1,2,3

0

8

4,5,6

0

На рис.5.6.3 приведена дендрограмма результатов кластерного анализа.

Расстояние

8

8,00

6

4

2

1 2 3 4 5 6

Номера объектов

Рис.5.6.3

Рассмотренные шесть примеров наглядно продемонстрировли методику применения основных методов кластерного анализа. Получение одинаковых результатов по всем рассмотренным методам объясняется сравнительной несложностью рассматриваемого примера. При усложнении

примера следует ожидать различий в результатах кластерного анализа.