- •Введение
- •1 Идентификация проблемной области
- •1.1 Постановка задачи
- •1.2 Назначение эс
- •1.3 Класс эс по решаемой задаче
- •2 Концептуализация предметной области
- •2.1 Извлечение знаний
- •2.1.1 Анализ методом главных компонент
- •2.1.2 Кластерный анализ
- •2.1.3 Кластерный анализ с помощью Карт Кохонена
- •2.1.4 Построение деревьев решений
- •2.2 Структурирование проблемной области
- •3 Формализация базы знании
- •3.1 Краткий обзор модели представления знаний
- •3.2 Обоснование выбора модели представления знаний
- •3.3 Таблицы решений
- •3.4 Сеть вывода
- •4 База знаний
- •Заключение
- •Приложение а – Исходная выборка исследуемых видеокарт
- •Приложение б – Принадлежность наблюдений к классам
2.1.2 Кластерный анализ
Этот анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации
Введем исходные данные в электронную таблицу STATGRAPHICS (50x10). Для более детального анализа проделали ряд операций. Получили дендрограмму методом Варда для трех кластеров (классов) (рисунок 2.3).
Рисунок 2.3 – Дендрограмма для трех классов
После преобразований получили сводку кластерного анализа (таблица 2.3).
Таблица 2.3
Сводка кластерного анализа
Cluster |
Members |
Percent |
1 |
14 |
28.00 |
2 |
26 |
52.00 |
3 |
10 |
20.00 |
Centroids: | |||||
Cluster |
Яркость |
Контрастность |
Горизонтальный угол обзора |
Вертикальный угол обзора, верхний | |
1 |
257,857 |
521,429 |
160,0 |
80,0 | |
2 |
313,077 |
496,154 |
148,462 |
66,8269 | |
3 |
327,0 |
655,0 |
164,0 |
82,0 | |
| |||||
|
Вертикальный угол обзора, нижний |
Время отклика |
Вес |
Потребление энергии |
Цена |
1 |
80,0 |
4,64286 |
9,42857 |
38,0 |
6876,0 |
2 |
66,6346 |
4,92692 |
10,5385 |
39,7692 |
7881,27 |
3 |
82,0 |
5,36 |
10,5 |
40,2 |
8368,5 |
Как видно из таблицы 2.3, в сводке кластерного анализа прежде всего учитываются имена переменных, участвующих в анализе, количество полных образцов, использованный метод кластерного анализа и принятая метрика. Затем, в сводке описывается число кластеров, количество объектов в каждом кластере и соответствующий процент. Кроме того, в нижней части сводки приводится дополнительная информация по координатам центроидов. По этим координатам можно судить о том, какие переменные играют наиболее важную роль в каждом кластере.
Таблица 2.4
Принадлежность объектов к кластерам
1 |
NEC 1704M |
1 |
2 |
Mitsubishi DiamondPoint |
2 |
3 |
Matrix XP1709 |
3 |
4 |
LG L1751SQ-SN Flatron |
1 |
5 |
LG L1751SQ-GN Flatron |
1 |
6 |
LG L1751SQ-BN Flatron |
1 |
7 |
LG L1750U-SN Flatron |
1 |
8 |
LG L1750SQ-SN Flatron |
1 |
9 |
LG L1750SQ-BN |
1 |
10 |
LG L1750B-SF Flatron |
3 |
11 |
LG L1750B-BF Flatron |
3 |
12 |
LG 1740PQ(N) Flatron |
3 |
13 |
LG L1740BQ Flatron |
1 |
14 |
LG L1740BN Flatron |
1 |
15 |
LG L1732S-BF Flatron |
3 |
16 |
LG L1730S SQT Flatron |
2 |
17 |
LG L1730P SUP Flatron |
2 |
18 |
LG L1721B Flatron |
1 |
19 |
LG L1720P Flatron |
2 |
20 |
LG L1720B Flatron |
2 |
21 |
LG L1717S-SN Flatron |
1 |
22 |
LG L1717S-BN Flatron |
1 |
23 |
Fujitsu-Siemens X17-2 |
2 |
24 |
Fujitsu-Siemens P17-1A |
2 |
25 |
Fujitsu-Siemens C17-3 |
2 |
26 |
BenQ T705 |
2 |
27 |
BenQ FP783-(Cam) |
3 |
28 |
BenQ FP72G+S |
2 |
29 |
BenQ FP72G+D |
3 |
30 |
BenQ FP71W |
3 |
31 |
BenQ FP72G+S |
2 |
32 |
BenQ FP71V+(Plus) |
2 |
33 |
BenQ FP71V |
3 |
34 |
BenQ FP71GX |
1 |
35 |
BenQ FP71G+(Plus) |
1 |
36 |
BenQ FP71E+(Plus) |
2 |
37 |
ASUS PM17TE |
2 |
38 |
ASUS MM17T |
2 |
39 |
Acer AL1751C |
2 |
40 |
Acer AL1751B |
2 |
41 |
Acer AL1751A |
2 |
42 |
Acer AL1717s/sm |
2 |
43 |
Acer AL1717as(m) |
2 |
44 |
Acer AL1716sd |
2 |
45 |
Acer AL1716S |
2 |
46 |
Acer AL1715AMS |
2 |
47 |
Acer AL1714SM |
2 |
48 |
NEC 1770GX-BK |
3 |
49 |
Viewsonic VG720 |
2 |
50 |
Viewsonic VG712S |
2 |
Перейдем к рассмотрению диаграммы рассеивания (рисунок 2.4)
Рисунок 2.4 − Двухмерная диаграмма рассеивания
Диаграмма показывает, как группируются исследуемые наблюдения на плоскости двух переменных Col_1 − уровень яркости монитора иCol_2 - уровень контрастности монитора. Каждый кластер представлен на диаграмме собственным символом. Из рисунка следует, что первый кластер включает мониторы с низким уровнем яркости и средним уровнем контрастности. Во втором кластере находятся мониторы со средним уровнем яркости и контрастности. В третий кластер попадают мониторы с низким уровнем яркости.
Рассмотрим трехмерную диаграмму рассеивания (рисунок 2.5)
Рисунок 2.5 − Трехмерная диаграмма рассеивания
Таким образом, кластерный анализ помог разбить множество объектов на заданное число классов на основании некоторого математического критерия качества классификации. Диаграмма показывает, как группируются исследуемые LCDмониторы в пространстве трех переменных: яркость, контрастность, горизонтальный угол обзора.