- •Введение
- •1 Идентификация проблемной области
- •1.1 Постановка задачи
- •1.2 Назначение эс
- •1.3 Класс эс по решаемой задаче
- •2 Концептуализация предметной области
- •2.1 Извлечение знаний
- •2.1.1 Анализ методом главных компонент
- •2.1.2 Кластерный анализ с применением дендрограмм
- •2.1.3 Кластерный анализ с применением карт Кахонена
- •2.1.3 Построение деревьев решений
- •2.2 Структурирование проблемной области
- •3 Формализация базы знаний
- •3 1 Краткий обзор модели представления знаний
- •3.2 Обоснование выбора модели представления знаний
- •3.3 Таблицы решений
- •3.4 Сеть вывода
- •4 База знаний
- •Заключение
- •Приложение а – Исходная выборка исследуемых телефонов
- •Приложение б – Принадлежность наблюдений к классам
2.1.2 Кластерный анализ с применением дендрограмм
Этот анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации
Введем исходные данные в электронную таблицу STATGRAPHICS (50x10). Для более детального анализа проделали ряд операций. Получили дендрограмму методом Варда для трех кластеров (классов) (рисунок 2.3).
Рисунок 2.3 – Дендрограмма для трех классов
После преобразований получили сводку кластерного анализа (таблица 2.5).
Таблица 2.5
Сводка кластерного анализа
Cluster |
Members |
Percent |
1 |
8 |
16.33 |
2 |
26 |
53.06 |
3 |
15 |
30.61 |
Centroids: | ||||||
Cluster |
Bluetooth |
GPRS |
MP3 |
WAP |
Антенна |
Вес |
1 |
0 |
0 |
0 |
0,125 |
0 |
87 |
2 |
0 |
1 |
0,115 |
1 |
0,269 |
93,6154 |
3 |
1 |
1 |
0,533 |
1 |
0,2 |
110,533 |
|
Тип |
Режим ожидания |
Режим разговора |
Ф/камера |
Кол-во цветов |
Цена |
1 |
0,125 |
385 |
5,76 |
0 |
9217 |
2005,38 |
2 |
0,423 |
256,654 |
4,26 |
0,53 |
48994 |
4372,81 |
3 |
0,333 |
193,733 |
3,96 |
1 |
1400083 |
8412,47 |
Как видно из таблицы 2.5, в сводке кластерного анализа прежде всего учитываются имена переменных, участвующих в анализе, количество полных образцов, использованный метод кластерного анализа и принятая метрика. Затем, в сводке описывается число кластеров, количество объектов в каждом кластере и соответствующий процент. Кроме того, в нижней части сводки приводится дополнительная информация по координатам центроидов. По этим координатам можно судить о том, какие переменные играют наиболее важную роль в каждом кластере.
Таблица 2.6
Принадлежность объектов к кластерам
1 |
Motorola C118 |
1 |
2 |
Motorola C139 |
1 |
3 |
Motorola C350 |
2 |
4 |
Motorola C380 |
2 |
5 |
Motorola V171 |
2 |
6 |
Motorola C390 |
2 |
7 |
Motorola V177 |
2 |
8 |
Motorola C257 |
2 |
9 |
Motorola C650 |
2 |
10 |
Motorola C261 |
2 |
11 |
Motorola V220 |
2 |
12 |
Motorola L6 |
3 |
13 |
Motorola V535 |
2 |
14 |
Motorola V360 |
3 |
15 |
Motorola E398 |
3 |
16 |
Motorola L7 |
3 |
17 |
Motorola V635 |
3 |
18 |
Motorola V3 |
3 |
19 |
Motorola PEBL U6 |
3 |
20 |
Nokia 1100 |
1 |
21 |
Nokia 1101 |
1 |
22 |
Nokia 2300 |
1 |
23 |
Nokia 1110 |
1 |
24 |
Nokia 2600 |
1 |
25 |
Nokia 1600 |
1 |
26 |
Nokia 2650 |
2 |
27 |
Nokia 3100 |
2 |
28 |
Nokia 2652 |
2 |
29 |
Nokia 3120 |
2 |
30 |
Nokia 6030 |
2 |
31 |
Nokia 3220 |
2 |
32 |
Nokia 6060 |
2 |
33 |
Nokia 6610i |
2 |
34 |
Nokia 6021 |
2 |
35 |
Nokia 6020 |
2 |
36 |
Nokia 6101 |
2 |
37 |
Nokia 5140i |
2 |
38 |
Nokia 6170 |
2 |
39 |
Nokia 7250 |
2 |
40 |
Nokia 6103 |
2 |
41 |
Nokia 6600 |
3 |
42 |
Nokia 6650 |
3 |
43 |
Nokia 3230 |
3 |
44 |
Nokia 7270 |
2 |
45 |
Nokia 6670 |
3 |
46 |
Nokia 6230i |
3 |
47 |
Nokia 7610 |
3 |
48 |
Nokia 6111 |
3 |
49 |
Nokia 6630 |
3 |
Перейдем к рассмотрению диаграммы рассеивания (рисунок 2.4)
Рисунок 2.4 − Двухмерная диаграмма рассеивания
Диаграмма показывает, как группируются исследуемые наблюдения на плоскости двух переменных Bluetooth− наличие функцииBluetoothиGPRS− наличие функцииGPRS. Каждый кластер представлен на диаграмме собственным символом. Из рисунка следует, что первый кластер включает мобильные телефоны безBluetoothиGPRS. Во втором кластере находятся телефоны с функциейGPRS. В третий кластер попадают телефоны, имеющие как функциюGPRS, так и функциюBluetooth.
Рассмотрим трехмерную диаграмму рассеивания (рисунок 2.5)
Рисунок 2.5 − Трехмерная диаграмма рассеивания
Таким образом, кластерный анализ помог разбить множество объектов на заданное число классов на основании некоторого математического критерия качества классификации. Диаграмма показывает, как группируются исследуемые мобильные телефоны в пространстве трех переменных: Bluetooth,GPRS,MP3.