
- •Лекция 5 группировки. Кластерный анализ
- •Пример 5.1. Кластерный анализ. Евклидово расстояние.
- •Пример 5.4. Кластерный анализ. Евклидово расстояние. По медиане
- •Пример 5.5. Кластерный анализ. Евклидово расстояние. По типовым представителям
- •Пример 5.6. Кластерный анализ. Расстояние Хемминга. Ближайший сосед
Пример 5.4. Кластерный анализ. Евклидово расстояние. По медиане
Требуется разделить шесть объектов на два кластера. Объекты –
информационные системы характеризуются двумя признаками:
Х1-среднее время решения одной задачи в минутах;
Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.
Значения признаков Х1 и Х2 для шести объектов представлены в таблице 19.21.
Таблица 19.21
|
1 |
2 |
3 |
4 |
5 |
6 |
X1 |
2 |
4 |
5 |
12 |
14 |
15 |
X2 |
8 |
10 |
7 |
6 |
6 |
4 |
Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 19.22.
Таблица 19.22
|
1 |
2 |
3 |
4 |
5 |
6 |
1 |
0 |
2,83 |
3,16 |
10,19 |
12,17 |
13,60 |
2 |
|
0 |
3,16 |
8,94 |
10,77 |
12,53 |
3 |
|
|
0 |
7,07 |
9,06 |
10,44 |
4 |
|
|
|
0 |
2,00 |
3,61 |
5 |
|
|
|
|
0 |
2,24 |
6 |
|
|
|
|
|
0 |
Жирным шрифтом в таблице 19.22 выделено наименьшее расстояние
между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «медианы» и представлены в таблице 19.23. Применение принципа по вычислению расстояния между первым объектом и формирующимся объектом, состоящим из 4 и 5 объектов поясняется рис.5.4.1.
4
b=3,61
6
m=2,83
a=2,00
c=2,24
5
Рис.5.4.1
Таблица 19.23
|
1 |
2 |
3 |
4,5 |
6 |
1 |
0 |
2,83 |
3,16 |
7,8692705 |
13,60 |
2 |
|
0 |
3,16 |
6,9266965 |
12,53 |
3 |
|
|
0 |
5,6583675 |
10,44 |
4,5 |
|
|
|
0 |
2,8328 |
6 |
|
|
|
|
0 |
Жирным шрифтом в таблице 19.23 выделено наименьшее расстояние
между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « медианы» и представлены в таблице 19.24.
Таблица 19.24
|
1,2 |
3 |
4,5 |
6 |
1,2 |
0 |
2,8254866 |
7,2767125 |
12.999162 |
3 |
|
0 |
5,6583675 |
10,44 |
4,5 |
|
|
0 |
2,8328 |
6 |
|
|
|
0 |
Жирным шрифтом в таблице 19.24 выделено наименьшее расстояние между объектом 1,2 и третьим объектом. Их объединяем в один объект 1,2.3. Расстояния между этим укрупнённым и другими объектами определены по
правилу «медианы» и представлены в таблице 19.25.
Таблица 19.25
|
1,2,3 |
4,5 |
6 |
1,2,3 |
0 |
6,363017 |
11,704275 |
4,5 |
|
0 |
2,8328 |
6 |
|
|
0 |
Жирным шрифтом в таблице 19.25 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектом. Их объединяем в
один объект 4,5,6. Расстояния между укрупнёнными объектами определены по правилу «медианы» и представлены в таблице 19.26.
Таблица 19.26
|
1,2,3 |
4,5,6 |
1,2,3 |
0 |
9,4201385 |
4,5,6 |
|
0 |
Таким образом, процесс кластерного анализа закончен. Выделено два
кластера. Расстояние между кластерами равно 9,42. Дендрограмма
результатов кластерного анализа представлена на рис. 19.11.
Расстояние
10
9,42
8
6
4
2
1 2 3 4 5 6
Номера объектов
Рис.19.11. Результаты кластерного анализа