- •Министерство образования и науки российской федерации
- •Теоретическая часть
- •Задача кластерного анализа
- •1.2 Методы кластерного анализа.
- •1.3 Алгоритмы кластеризации
- •1.4 Число кластеров
- •1.5 Дендограммы
- •Практическая часть
- •1 3 6 2 8 4 9 10 7 5
- •Пример решения в программе spss 11.0
- •Пример решения в программе statistica
- •Задание к лабораторной работе
- •Заключение
- •Список литературы
- •Приложение
1 3 6 2 8 4 9 10 7 5
Рис. 3
На
основании полученной дендрограммы
можно разбить исходную выборку примерно
на два основных кластера (по значению
минимального расстояния min(dij)
2.6):
(1, 3, 6) и (2, 8, 4, 9, 10). Это говорит о том, что
в данной выборке (из10
больных) присутствуют два различных
заболевания (например, желудочковая
экстрасистолия и ишемическая дисфункция
левого желудочка).
Пример решения в программе spss 11.0
Запустите программу SPSS 11.
Выберите в меню Fail… (файл) New… (новый) Data… (данные)
Заполните матрицу данных предварительно нормированными значениями в соответствии с вариантом. В панели данных введите заданные данные, а в панели вид переменной задайте имя и тип переменной.

4) Выберите в меню Analyze (Анализ) Classify (Классифицировать) Hierarchical Cluster... (Иерархический кластерный анализ). Перенесите значения (p1, p2, ph, pq, hr, st) в поле переменных.

5) В меню статистика поставьте галочку в поле proximity matrix и нажмите кнопку продолжить.

6) В меню графики поставьте галочку в поле dendrogram и выберите положение дендрограммы (вертикальное или горизонтальное) и нажмите кнопку продолжить.

7) В меня метод выберите способ расчета расстояния(в нашем случае евклидово растояние), и метод кластерного анализа (в нашем случае ближайший сосед) и нажмите кнопку продолжить.

8) Ничего больше не меняя, начните расчет нажатием кнопки ОК.
Вывод основных результатов выглядит следующим образом:
_
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *
Dendrogram using Single Linkage
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1
3
6
9
10
4
2
8
7
5
Результат соответствует результатам, полученным в программе MathCAD.
Пример решения в программе statistica
1) Запустите программу STATICTICA 6.0
Выберите в меню Файл…Новый…создайте таблицу данных.
Заполните матрицу данных нормированными значениями, заданными в соответствии с вариантом.

Выберите в меню Статистика…Многомерные исследовательские методы…Анализ кластера…Joining(Tree clustering). Далее в меню Variables выделите значения и нажмите кнопку ОК.

В меню Advanced выберите способ расчета расстояния метод кластерного анализа и нажмите кнопку ОК.

В полученном окне выбираем Distance matrix.

И получаем матрицу расстояний:

При нажатии кнопки Horizontal hierarchical tree plots получаем дендрограмму

Результат соответствует результатам, полученным в программе MathCAD и SPSS.
