- •Введение
- •1 Идентификация проблемной области
- •1.1 Постановка задачи
- •1.2 Назначение эс
- •1.3 Класс эс по решаемой задаче
- •2.1.2 Кластерный анализ с применением дендрограмм
- •2.1.3 Кластерный анализ с применением карт Кахонена
- •2.1.3 Построение деревьев решений
- •2.2 Структурирование проблемной области
- •3 Формализация базы знаний
- •3 1 Краткий обзор модели представления знаний
- •3.2 Обоснование выбора модели представления знаний
- •3.3 Таблицы решений
- •3.4 Сеть вывода
- •4 База знаний
- •Заключение
- •Приложение а – Исходная выборка исследуемых процессоров
- •Приложение б – Принадлежность наблюдений к классам
1 Идентификация проблемной области
1.1 Постановка задачи
Разработать ЭС, для применения ее в автоматизации отдела продаж магазина компьютерной техники. Данная программа позволяет классифицировать процессоры по нескольким признакам.
1.2 Назначение эс
Назначение ЭС − консультирование в области принятия решений и формирование списка процессоров из каталога, которые соответствуют требованиям покупателя.
Особенности решения задачи связаны с тем, что ЭС настраивается на требования и запросы пользователя. ЭС должна выполнять функции когнитолога, поддерживать интерфейс пользователя, а также хранить и пополнять БЗ в отдельном файле. ЭС должна выдавать класс процессора.
Цель разработки ЭС - консультация сотрудников отдела продаж магазина в процессе обслуживания клиентов.
1.3 Класс эс по решаемой задаче
Класс решаемой задачи - задача классификации. ЭС позволяет сформировать несколько классов процессоров.
1.4 Цель
Цель − отнести процессор к какому-либо классу.
Целевая переменная "Класс" принимает следующие значения Класс = 1, Класс = 2, Класс = 3, Класс = 4, Класс = 5.
1.5 Ожидаемые результаты
Разработать ЭС, для применения ее в автоматизации отдела продаж компьютерного магазина. Сформировать множество возможных действий по мотивации покупателя в соответствии с заданными требованиями.
1.6 Промежуточные цели
Промежуточные цели при построении данной ЭС определяются такими переменными, как: Comp1 = большая, средняя, малая; Comp2 = большая, средняя, малая, Comp3 = большая, средняя, малая.
1.7 Исходные данные
Исходные данные при построении данной ЭС определяются такими переменными, как:
1. Тактовая частота процессора = [1400, 3400]
2. Тактовая частота шины = [266, 1000]
3. Размер кэша первого уровня = [8, 256]
4. Размер кэша второго уровня = [64, 4096]
5. Технология = [0,065, 0, 18]
6. Умножение = [9, 22]
7. Критическая температура = [64, 90]
8. Цена = [1165, 17907]
2 Концептуализация предметной области
2.1 Извлечение знаний
2.1.1 Анализ методом главных компонент
Метод главных компонент даст возможность по pисходным признакам выделить в общем случаерглавных компонент
Введем исходные данные в электронную таблицу STATGRAPHICS (50x10) Исходная сводка анализа метода главных компонент (МГК) представлена в таблице 2.1.
Таблица 2.1
Исходная сводка МГК
Component Number |
Eigen Value |
Percent of Variance |
Cumulative Percentage |
1 |
2.6659 |
33.324 |
33.324 |
2 |
2.49185 |
31.148 |
64.472 |
3 |
1.27892 |
15.987 |
80.458 |
4 |
0.650956 |
8.137 |
88.595 |
5 |
0.4107778 |
5.135 |
93.730 |
6 |
0.30593 |
3.824 |
97.554 |
7 |
0.111957 |
1.399 |
98.954 |
8 |
0.0837057 |
1.046 |
100 |
Number of complete cases : 50 |
Из полученной сводки заключаем, что анализу подвергаются следующие переменные: тактовая частота процессора, тактовая частота, размер кэша первого уровня, размер кэша второго уровня, технология, умножение, критическая температура, цена и что число объектов составляет 50.
Далее следует информация непосредственно МГК собственные значения главных компонент, упорядоченные по величине (Eigenvalue), процент дисперсии, приходящийся на каждую выделенную главную компоненту (Percent of Variance), накопленный процент дисперсии (Cumulative Percentage).
Приведенные цифры говорят о том, что уже первые две главные компоненты описывают 64,472% дисперсии исходных данных. Третья главная компонента добавляет еще 15,987% дисперсии, так что в сумме получается 80,459% дисперсии.
Для более детального анализа проделали еще ряд операций. Получили веса признаков в главных компонентах (таблица 2.2).
Таблица 2.2
Веса признаков в главных компонентах
|
Component1 |
Component2 |
Component3 |
CPU Frequency |
0.454925 |
-0.168121 |
0.425524 |
Bus Frequency |
0.206333 |
0.525724 |
-0.101348 |
L1 Cache |
-0.225734 |
0.529226 |
-0.1184 |
L2 Cache |
0.483859 |
0.0754276 |
0.325518 |
Technology |
-0.40149 |
-0.0564815 |
0.412268 |
Multiplication |
0.298765 |
-0.458693 |
-0.245241 |
Critical Temperature |
-0.361731 |
-0.114191 |
0.591219 |
Cost |
0.289984 |
0.427728 |
0.330197 |
Как следует из полученных цифр, в первой компоненте наблюдается наибольшая прямопропорциональная зависимость от частоты процессора, размера кэша второго уровня, умножения и обратнопропорциональная зависимость от критической температуры и технологии. Во второй главной компоненте наблюдается прямопропорциональная зависимость от частоты шины, размера кэша первого уровня и цены. В третьей главной компоненте наибольшая прямопропорциональная зависимость от частоты процессора, технологии, критической температуры и цены.
Перейдем к рассмотрению диаграммы рассеивания всей совокупности процессоров на плоскости выделенных двух главных компонент (рисунок 2.1).
Рисунок 2.1 – Проекция исследуемых процессоров на пространство двух ГК
На представленном рисунке хорошо видно, что вся исследуемая совокупность телефонов разделилась на пять достаточно четких классов.
Рисунок 2.2 – Проекция исследуемых процессоров на пространство трех ГК
Выбор значащих компонент и определение названия для них представлено ниже.
1) Выберем p=3 главных компонент.
2) Определим названия для них по формуле:
,
где [wkj] – подмножество участвующих в названии весовых коэффициентовj-й компоненты;
[wj] – все весовые коэффициентыj-й компоненты.
0.454925 |
-0.168121 |
0.425524 | |
0.206333 |
0.525724 |
-0.101348 | |
-0.225734 |
0.529226 |
-0.1184 | |
0.483859 |
0.0754276 |
0.325518 | |
-0.40149 |
-0.0564815 |
0.412268 | |
0.298765 |
-0.458693 |
-0.245241 | |
-0.361731 |
-0.114191 |
0.591219 | |
0.289984 |
0.427728 |
0.330197 |
Для первой компоненты имеем:
Т.к. принадлежит интервалу [0,75; 0,95], значит, первая главная компонента определяется (более чем на 82,2%) следующими показателями: частота процессора, размер кэша второго уровня, технология, умножение, критическая температура.
Для второй компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, вторая главная компонента определяется (более чем на 76,6%) следующими показателями: частота шины, размера кэша первого уровня, умножение.
Для третьей компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, третья главная компонента определяется (более чем на 81%) следующими показателями: частота процессора, технология, критическая температура, цена.
Характеристика классов относительно компонент представлена в таблице 2.3.
Таблица 2.3
Характеристика классов относительно компонент
Класс |
Значение компоненты | ||
Компонента 1 |
Компонента 2 |
Компонента 3 | |
1 |
высокое |
высокое |
среднее |
2 |
высокое |
среднее |
среднее |
3 |
высокое |
высокое |
высокое |
4 |
среднее |
среднее |
среднее |
5 |
низкое |
низкое |
высокое |
Характеристика классов относительно признаков представлена в таблице 2.4.
Таблица 2.4.
Характеристика классов относительно признаков
|
Класс | ||||
Значение признака |
1 |
2 |
3 |
4 |
5 |
CPU Frequency |
высокое |
высокое |
высокое |
среднее |
низкое |
Bus Frequency |
высокое |
среднее |
высокое |
среднее |
низкое |
L1 Cache |
высокое |
среднее |
высокое |
среднее |
низкое |
L2 Cache |
высокое |
высокое |
высокое |
среднее |
низкое |
Technology |
низкое |
низкое |
высокое |
среднее |
высокое |
Multiplication |
высокое |
высокое |
высокое |
среднее |
низкое |
Critical Temperature |
низкое |
низкое |
низкое |
среднее |
высокое |
Cost |
высокое |
среднее |
высокое |
среднее |
среднее |