- •Введение
- •1 Идентификация проблемной области
- •1.1 Постановка задачи
- •1.2 Назначение эс
- •1.3 Класс эс по решаемой задаче
- •2 Концептуализация предметной области
- •2.1 Извлечение знаний
- •2.1.1 Анализ методом главных компонент
- •2.1.2 Кластерный анализ
- •2.1.3 Кластерный анализ с помощью Карт Кохонена
- •2.1.4 Построение деревьев решений
- •2.2 Структурирование проблемной области
- •3 Формализация базы знании
- •3.1 Краткий обзор модели представления знаний
- •3.2 Обоснование выбора модели представления знаний
- •3.3 Таблицы решений
- •3.4 Сеть вывода
- •4 База знаний
- •Заключение
- •Приложение а – Исходная выборка исследуемых видеокарт
- •Приложение б – Принадлежность наблюдений к классам
2.1.2 Кластерный анализ
Этот анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации
Введем исходные данные в электронную таблицу STATGRAPHICS (50x10). Для более детального анализа проделали ряд операций. Получили дендрограмму методом Варда для трех кластеров (классов) (рисунок 2.3).

Рисунок 2.3 – Дендрограмма для трех классов
После преобразований получили сводку кластерного анализа (таблица 2.3).
Таблица 2.3
Сводка кластерного анализа
|
Cluster |
Members |
Percent |
|
1 |
14 |
28.00 |
|
2 |
26 |
52.00 |
|
3 |
10 |
20.00 |
|
Centroids: | |||||
|
Cluster |
Яркость |
Контрастность |
Горизонтальный угол обзора |
Вертикальный угол обзора, верхний | |
|
1 |
257,857 |
521,429 |
160,0 |
80,0 | |
|
2 |
313,077 |
496,154 |
148,462 |
66,8269 | |
|
3 |
327,0 |
655,0 |
164,0 |
82,0 | |
|
| |||||
|
|
Вертикальный угол обзора, нижний |
Время отклика |
Вес |
Потребление энергии |
Цена |
|
1 |
80,0 |
4,64286 |
9,42857 |
38,0 |
6876,0 |
|
2 |
66,6346 |
4,92692 |
10,5385 |
39,7692 |
7881,27 |
|
3 |
82,0 |
5,36 |
10,5 |
40,2 |
8368,5 |
Как видно из таблицы 2.3, в сводке кластерного анализа прежде всего учитываются имена переменных, участвующих в анализе, количество полных образцов, использованный метод кластерного анализа и принятая метрика. Затем, в сводке описывается число кластеров, количество объектов в каждом кластере и соответствующий процент. Кроме того, в нижней части сводки приводится дополнительная информация по координатам центроидов. По этим координатам можно судить о том, какие переменные играют наиболее важную роль в каждом кластере.
Таблица 2.4
Принадлежность объектов к кластерам
|
1 |
NEC 1704M |
1 |
|
2 |
Mitsubishi DiamondPoint |
2 |
|
3 |
Matrix XP1709 |
3 |
|
4 |
LG L1751SQ-SN Flatron |
1 |
|
5 |
LG L1751SQ-GN Flatron |
1 |
|
6 |
LG L1751SQ-BN Flatron |
1 |
|
7 |
LG L1750U-SN Flatron |
1 |
|
8 |
LG L1750SQ-SN Flatron |
1 |
|
9 |
LG L1750SQ-BN |
1 |
|
10 |
LG L1750B-SF Flatron |
3 |
|
11 |
LG L1750B-BF Flatron |
3 |
|
12 |
LG 1740PQ(N) Flatron |
3 |
|
13 |
LG L1740BQ Flatron |
1 |
|
14 |
LG L1740BN Flatron |
1 |
|
15 |
LG L1732S-BF Flatron |
3 |
|
16 |
LG L1730S SQT Flatron |
2 |
|
17 |
LG L1730P SUP Flatron |
2 |
|
18 |
LG L1721B Flatron |
1 |
|
19 |
LG L1720P Flatron |
2 |
|
20 |
LG L1720B Flatron |
2 |
|
21 |
LG L1717S-SN Flatron |
1 |
|
22 |
LG L1717S-BN Flatron |
1 |
|
23 |
Fujitsu-Siemens X17-2 |
2 |
|
24 |
Fujitsu-Siemens P17-1A |
2 |
|
25 |
Fujitsu-Siemens C17-3 |
2 |
|
26 |
BenQ T705 |
2 |
|
27 |
BenQ FP783-(Cam) |
3 |
|
28 |
BenQ FP72G+S |
2 |
|
29 |
BenQ FP72G+D |
3 |
|
30 |
BenQ FP71W |
3 |
|
31 |
BenQ FP72G+S |
2 |
|
32 |
BenQ FP71V+(Plus) |
2 |
|
33 |
BenQ FP71V |
3 |
|
34 |
BenQ FP71GX |
1 |
|
35 |
BenQ FP71G+(Plus) |
1 |
|
36 |
BenQ FP71E+(Plus) |
2 |
|
37 |
ASUS PM17TE |
2 |
|
38 |
ASUS MM17T |
2 |
|
39 |
Acer AL1751C |
2 |
|
40 |
Acer AL1751B |
2 |
|
41 |
Acer AL1751A |
2 |
|
42 |
Acer AL1717s/sm |
2 |
|
43 |
Acer AL1717as(m) |
2 |
|
44 |
Acer AL1716sd |
2 |
|
45 |
Acer AL1716S |
2 |
|
46 |
Acer AL1715AMS |
2 |
|
47 |
Acer AL1714SM |
2 |
|
48 |
NEC 1770GX-BK |
3 |
|
49 |
Viewsonic VG720 |
2 |
|
50 |
Viewsonic VG712S |
2 |
Перейдем к рассмотрению диаграммы рассеивания (рисунок 2.4)




Рисунок 2.4 − Двухмерная диаграмма рассеивания
Диаграмма показывает, как группируются исследуемые наблюдения на плоскости двух переменных Col_1 − уровень яркости монитора иCol_2 - уровень контрастности монитора. Каждый кластер представлен на диаграмме собственным символом. Из рисунка следует, что первый кластер включает мониторы с низким уровнем яркости и средним уровнем контрастности. Во втором кластере находятся мониторы со средним уровнем яркости и контрастности. В третий кластер попадают мониторы с низким уровнем яркости.
Рассмотрим трехмерную диаграмму рассеивания (рисунок 2.5)




Рисунок 2.5 − Трехмерная диаграмма рассеивания
Таким образом, кластерный анализ помог разбить множество объектов на заданное число классов на основании некоторого математического критерия качества классификации. Диаграмма показывает, как группируются исследуемые LCDмониторы в пространстве трех переменных: яркость, контрастность, горизонтальный угол обзора.
