
- •Лекция 5 группировки. Кластерный анализ
- •Пример 5.1. Кластерный анализ. Евклидово расстояние.
- •Пример 5.4. Кластерный анализ. Евклидово расстояние. По медиане
- •Пример 5.5. Кластерный анализ. Евклидово расстояние. По типовым представителям
- •Пример 5.6. Кластерный анализ. Расстояние Хемминга. Ближайший сосед
Пример 5.5. Кластерный анализ. Евклидово расстояние. По типовым представителям
Требуется разделить шесть объектов на два кластера. Объекты –
информационные системы характеризуются двумя признаками:
Х1-среднее время решения одной задачи в минутах;
Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.
Значения признаков Х1 и Х2 для шести объектов представлены в таблице 19.27.
Таблица 19.27
|
1 |
2 |
3 |
4 |
5 |
6 |
X1 |
2 |
4 |
5 |
12 |
14 |
15 |
X2 |
8 |
10 |
7 |
6 |
6 |
4 |
Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 19.28.
Таблица 19.28
|
1 |
2 |
3 |
4 |
5 |
6 |
1 |
0 |
2,83 |
3,16 |
10,19 |
12,17 |
13,60 |
2 |
|
0 |
3,16 |
8,94 |
10,77 |
12,53 |
3 |
|
|
0 |
7,07 |
9,06 |
10,44 |
4 |
|
|
|
0 |
2,00 |
3,61 |
5 |
|
|
|
|
0 |
2,24 |
6 |
|
|
|
|
|
0 |
Жирным шрифтом в таблице 19.28 выделено наибольшее расстояние
между первым и шестым объектами. Их выбираем в качестве типовых и составим матрицу расстояний между выбранными типовыми и остальными объектами и подсчитаем разницу расстояний каждого объекта от типовых. Результаты вычислений представим в таблице 19.29.
Таблица 19.29
|
1 |
6 |
1-6 |
6-1 |
2 |
2,83 |
12,53 |
-9,70 |
9,70 |
3 |
3,16 |
10,44 |
-7,28 |
7,28 |
4 |
10,19 |
3,61 |
6.51 |
-6,51 |
5 |
12,87 |
2,24 |
10,63 |
-10,63 |
Жирным шрифтом в таблице 19.29 выделены наименьшие расстояния
между первым и вторым объектами и шестым и пятым объектами. Их объединяем в объекты 1,2 и 5,6. Определим расстояния от укрупнённых объектов до третьего и четвёртого объектов, не вошедших в формируемые кластеры по правилу «ближайшего соседа». Аналогично таблице 19.29 составим следующую таблицу 19.30.
Таблица 19.30
|
1,2 |
5,6 |
1,2-5,6 |
5,6-1,2 |
3 |
3,16 |
9,06 |
-5,90 |
5,90 |
4 |
8,94 |
2,00 |
6,94 |
-6,94 |
По наименьшему расстоянию формируем два кластера 1,2,3 и 4,5,6.Таким образом, процесс кластерного анализа закончен. Выделено два кластера. Дендрограмма результатов кластерного анализа изображена на
рис.5.5.2.
14 Расстояние
13,60
12
. . .
. . .
. . .
4
2
1 2 3 4 5 6
Номера объектов
Рис.19.12