Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Стат. обр. 4195-96. 2014 / Конспект лекции 5.Кластерный анализ.docx
Скачиваний:
237
Добавлен:
12.03.2015
Размер:
231.56 Кб
Скачать

Пример 5.5. Кластерный анализ. Евклидово расстояние. По типовым представителям

Требуется разделить шесть объектов на два кластера. Объекты –

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 19.27.

Таблица 19.27

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 19.28.

Таблица 19.28

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 19.28 выделено наибольшее расстояние

между первым и шестым объектами. Их выбираем в качестве типовых и составим матрицу расстояний между выбранными типовыми и остальными объектами и подсчитаем разницу расстояний каждого объекта от типовых. Результаты вычислений представим в таблице 19.29.

Таблица 19.29

1

6

1-6

6-1

2

2,83

12,53

-9,70

9,70

3

3,16

10,44

-7,28

7,28

4

10,19

3,61

6.51

-6,51

5

12,87

2,24

10,63

-10,63

Жирным шрифтом в таблице 19.29 выделены наименьшие расстояния

между первым и вторым объектами и шестым и пятым объектами. Их объединяем в объекты 1,2 и 5,6. Определим расстояния от укрупнённых объектов до третьего и четвёртого объектов, не вошедших в формируемые кластеры по правилу «ближайшего соседа». Аналогично таблице 19.29 составим следующую таблицу 19.30.

Таблица 19.30

1,2

5,6

1,2-5,6

5,6-1,2

3

3,16

9,06

-5,90

5,90

4

8,94

2,00

6,94

-6,94

По наименьшему расстоянию формируем два кластера 1,2,3 и 4,5,6.Таким образом, процесс кластерного анализа закончен. Выделено два кластера. Дендрограмма результатов кластерного анализа изображена на

рис.5.5.2.

14 Расстояние

13,60

12

. . .

. . .

. . .

4

2

1 2 3 4 5 6

Номера объектов

Рис.19.12