- •Введение
- •1 Идентификация проблемной области
- •1.1 Постановка задачи
- •1.2 Назначение эс
- •1.3 Класс эс по решаемой задаче
- •2 Концептуализация предметной области
- •2.1 Извлечение знаний
- •2.1.1 Анализ методом главных компонент
- •2.1.2 Кластерный анализ с помощью дендрограмм
- •2.1.3 Кластерный анализ с помощью Карт Кохонена
- •2.1.4 Построение деревьев решений
- •2.2 Структурирование проблемной области
- •3 Формализация базы знании
- •3.1 Краткий обзор модели представления знаний
- •3.2 Обоснование выбора модели представления знаний
- •3.3 Таблицы решений
- •3.4 Сеть вывода
- •4 База знаний
- •Заключение
- •Приложение а – Исходная выборка исследуемых видеокарт
- •Приложение б – Принадлежность наблюдений к классам
1 Идентификация проблемной области
1.1 Постановка задачи
Разработать ЭС, для применения ее в автоматизации отдела продаж компьютерного магазина. Данная программа позволяет выдавать рекомендации пользователю по принимаемым решениям при выборе комплектующих компьютерной техники (видеокарты).
1.2 Назначение эс
Назначение ЭС − консультирование в области принятия решений и формирование списка видеокарт из каталога, которые соответствуют требованиям покупателя.
Особенности решения задачи связаны с тем, что ЭС настраивается на требования и запросы пользователя. ЭС должна выполнять функции когнитолога, поддерживать интерфейс пользователя, а также хранить и пополнять БЗ в отдельном файле. ЭС должна выдавать рекомендации лицу, принимающему решение (ЛПР), по принимаемым решениям при выборе комплектующих для компьютера (видеокарты).
Цель разработки ЭС - консультация сотрудников отдела продаж компьютерного магазина в процессе обслуживания клиентов.
1.3 Класс эс по решаемой задаче
Класс решаемой задачи - задача поддержки принятия решения (ПНР). ЭС позволяет сформировать множество рекомендации но решению каких-либо задач и представить их в удобной форме.
1.4 Цель
Цель − выдавать рекомендации по выбору видеокарты при комплектации системного блока.
Целевая переменная "Решение" принимает следующие значения Решение = покупать. Решение = не покупать.
1.5 Ожидаемые результаты
Разработать ЭС, для применения ее в автоматизации отдела продаж компьютерного магазина. Сформировать множество возможных действий по мотивации покупателя в соответствии с заданными требованиями.
1.6 Промежуточные цели
Промежуточные цели при построении данной ЭС определяются такими переменными, как: Comp1= большая, средняя, малая;Comp2= большая, средняя, малая,Comp3= большая, средняя, малая;Класс= 1, 2, 3, не определен.
1.7 Исходные данные
Исходные данные при построении данной ЭС определяются такими переменными, как:
1. Цена = [1000, 23000]
2. Объем памяти (0– 64, 1– 128, 2– 256, 3– 512) = {0, 1, 2, 3}
3. Тип шины (0 – AGP, 1 –PCI-X) = {0, 1}
4. Разрядность шины памяти (0– 64, 1– 128, 2– 256) = {0, 1, 2}
5. Частота чипа = [200, 650]
6. Частота памяти = [150, 1200]
7. Наличие SLI(0 – Нет, 1 – Да) = {0, 1}
8. Наличие DVI(0 – Нет, 1 – Да) = {0, 1}
9. Наличие TV-In(0 – Нет, 1 – Да) = {0, 1}
10. Наличие TV-Out(0 – Нет, 1 – Да) = {0, 1}
2 Концептуализация предметной области
2.1 Извлечение знаний
2.1.1 Анализ методом главных компонент
Метод главных компонент даст возможность по pисходным признакам выделить в общем случаерглавных компонент
Введем исходные данные в электронную таблицу STATGRAPHICS(50x10) Исходная сводка анализа метода главных компонент (МГК) представлена в таблице 2.1.
Таблица 2.1
Исходная сводка МГК
Component Number |
Eigen Value |
Percent of Variance |
Cumulative Percentage |
1 |
3.850 |
38.495 |
38.495 |
2 |
1.248 |
12.479 |
50.973 |
3 |
1.108 |
11.077 |
62.050 |
4 |
0.982 |
9.918 |
71.867 |
5 |
0.836 |
8.364 |
80.231 |
6 |
0.618 |
6.182 |
86.413 |
7 |
0.526 |
5.264 |
91.676 |
8 |
0.357 |
3.575 |
95.251 |
9 |
0.281 |
2.811 |
98.062 |
10 |
0.194 |
1.938 |
100.000 |
Number of complete cases : 50 |
Из полученной сводки заключаем, что анализу подвергаются переменные цена, объем памяти, тип шины, разрядность шины памяти, частота чипа, частита памяти, наличие SLI, наличиеDVI, наличиеTVIn, наличиеTVOutи что число объектов составляет 50.
Далее следует информация непосредственно МГК собственные значения главных компонент, упорядоченные по величине (Eigenvalue), процент дисперсии, приходящийся на каждую выделенную главную компоненту (Percent of Variance), накопленный процент дисперсии (Cumulative Percentage).
Приведенные цифры говорят о том, что уже первые две главные компоненты описывают 50,973% дисперсии исходных данных. Третья главная компонента добавляет еще 11,077% дисперсии, так что в сумме получается 62,050% дисперсии.
Для более детального анализа проделали еще ряд операций. Получили веса признаков в главных компонентах (таблица 2.2).
Таблица 2.2
Веса признаков в главных компонентах
|
Component1 |
Component2 |
Component3 |
Цена |
0.432 |
0.048 |
-0.178 |
Объем памяти |
0.347 |
0.334 |
0.270 |
Тип шины |
0.284 |
-0.563 |
0.040 |
Разрядность шины памяти |
0.411 |
0.202 |
0.272 |
Частота чипа |
0.380 |
0.037 |
-0.248 |
Частота памяти |
0.333 |
-0.120 |
-0.260 |
Наличие SLI |
0.222 |
-0.325 |
-0.055 |
Наличие DVI |
0.063 |
0.637 |
-0.191 |
Наличие TV-In |
0.325 |
0.015 |
-0.209 |
Наличие TV-Out |
0.171 |
-0.038 |
0.779 |
Как следует из полученных цифр, в первой компоненте наблюдается наибольшая зависимость от цены, объема памяти, частоты и разрядность шины, частоты памяти и наличия TVIn. Во второй главной компоненте наблюдается сочетание объема памяти, типа шины, и наличия выходаDVI. В третьей главной компоненте наибольшие веса имеют объем памяти, ее разрядность и наличие выходаTVOut.
Перейдем к рассмотрению диаграммы рассеивания всей совокупности работников на плоскости выделенных двух главных компонент (рисунок 2.1).
Рисунок 2.1 – Проекция исследуемых видеокарт на пространство двух ГК
На представленном рисунке хорошо видно, что вся исследуемая совокупность работников разделилась на три достаточно четких класса.
Рисунок 2.2 – Проекция исследуемых видеокарт на пространство трех ГК
Выбор значащих компонент и определение названия для них представлено ниже.
1) Выберем p=3 главных компонент.
2) Определим названия для них по формуле:
,
где [wkj] – подмножество участвующих в названии весовых коэффициентовj-й компоненты;
[wj] – все весовые коэффициентыj-й компоненты.
Для первой компоненты имеем:
Т.к. принадлежит интервалу [0,75; 0,95], значит, первая главная компонента определяется (более чем на 83,5%) следующими показателями: цены, объем памяти, частота и разрядность шины, частота памяти и наличие входаTVIn
Для второй компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, вторая главная компонента определяется (более чем на 83,4%) следующими показателями: объем памяти, тип шины, и наличия выходаDVI.
Для третьей компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, третья главная компонента определяется (более чем на 75,4%) следующими показателями: объем памяти, ее разрядность и наличие выходаTVOut.