Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Стат. обр. 4195-96. 2014 / Конспект лекции 5.Кластерный анализ.docx
Скачиваний:
237
Добавлен:
12.03.2015
Размер:
231.56 Кб
Скачать

Пример 5.4. Кластерный анализ. Евклидово расстояние. По медиане

Требуется разделить шесть объектов на два кластера. Объекты –

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 19.21.

Таблица 19.21

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 19.22.

Таблица 19.22

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 19.22 выделено наименьшее расстояние

между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «медианы» и представлены в таблице 19.23. Применение принципа по вычислению расстояния между первым объектом и формирующимся объектом, состоящим из 4 и 5 объектов поясняется рис.5.4.1.

4

b=3,61

6

m=2,83 a=2,00

c=2,24

5

Рис.5.4.1

Таблица 19.23

1

2

3

4,5

6

1

0

2,83

3,16

7,8692705

13,60

2

0

3,16

6,9266965

12,53

3

0

5,6583675

10,44

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 19.23 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « медианы» и представлены в таблице 19.24.

Таблица 19.24

1,2

3

4,5

6

1,2

0

2,8254866

7,2767125

12.999162

3

0

5,6583675

10,44

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 19.24 выделено наименьшее расстояние между объектом 1,2 и третьим объектом. Их объединяем в один объект 1,2.3. Расстояния между этим укрупнённым и другими объектами определены по

правилу «медианы» и представлены в таблице 19.25.

Таблица 19.25

1,2,3

4,5

6

1,2,3

0

6,363017

11,704275

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 19.25 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектом. Их объединяем в

один объект 4,5,6. Расстояния между укрупнёнными объектами определены по правилу «медианы» и представлены в таблице 19.26.

Таблица 19.26

1,2,3

4,5,6

1,2,3

0

9,4201385

4,5,6

0

Таким образом, процесс кластерного анализа закончен. Выделено два

кластера. Расстояние между кластерами равно 9,42. Дендрограмма

результатов кластерного анализа представлена на рис. 19.11.

Расстояние

10

9,42

8

6

4

2

1 2 3 4 5 6

Номера объектов

Рис.19.11. Результаты кластерного анализа