- •Введение
- •1 Идентификация проблемной области
- •1.1 Постановка задачи
- •1.2 Назначение эс
- •1.3 Класс эс по решаемой задаче
- •2 Концептуализация предметной области
- •2.1 Извлечение знаний
- •2.1.1 Анализ методом главных компонент
- •2.1.2 Кластерный анализ с применением дендрограмм
- •2.1.3 Кластерный анализ с применением карт Кахонена
- •2.1.3 Построение деревьев решений
- •2.2 Структурирование проблемной области
- •3 Формализация базы знаний
- •3 1 Краткий обзор модели представления знаний
- •3.2 Обоснование выбора модели представления знаний
- •3.3 Таблицы решений
- •3.4 Сеть вывода
- •4 База знаний
- •Заключение
- •Приложение а – Исходная выборка исследуемых телефонов
- •Приложение б – Принадлежность наблюдений к классам
1 Идентификация проблемной области
1.1 Постановка задачи
Разработать ЭС, для применения ее в автоматизации отдела продаж магазина мобильных телефонов. Данная программа позволяет классифицировать телефоны по нескольким признакам.
1.2 Назначение эс
Назначение ЭС − консультирование в области принятия решений и формирование списка мобильных телефонов из каталога, которые соответствуют требованиям покупателя.
Особенности решения задачи связаны с тем, что ЭС настраивается на требования и запросы пользователя. ЭС должна выполнять функции когнитолога, поддерживать интерфейс пользователя, а также хранить и пополнять БЗ в отдельном файле. ЭС должна выдавать класс мобильного телефона.
Цель разработки ЭС - консультация сотрудников отдела продаж магазина в процессе обслуживания клиентов.
1.3 Класс эс по решаемой задаче
Класс решаемой задачи - задача классификации. ЭС позволяет сформировать несколько классов мобильных телефонов.
1.4 Цель
Цель − отнести мобильный телефон к какому-либо классу.
Целевая переменная "Класс" принимает следующие значения Класс = 1, Класс = 2, Класс = 3.
1.5 Ожидаемые результаты
Разработать ЭС, для применения ее в автоматизации отдела продаж компьютерного магазина. Сформировать множество возможных действий по мотивации покупателя в соответствии с заданными требованиями.
1.6 Промежуточные цели
Промежуточные цели при построении данной ЭС определяются такими переменными, как: Comp1 = большая, средняя, малая; Comp2 = большая, средняя, малая, Comp3 = большая, средняя, малая.
1.7 Исходные данные
Исходные данные при построении данной ЭС определяются такими переменными, как:
1. Время работы в режиме разговора = [2, 11]
2. Время работы в режиме ожидания = [80, 450]
3. Наличие Bluetooth (0 – Нет, 1 – Да) = {0, 1}
4. Количество цветов дисплея [1, 262144]
5. Вес = [88, 141]
6. Тип антенны = (0 – Внутренняя, 1 – Внешняя) = {0, 1}
7. Наличие фотокамеры = (0 – Нет, 1 – Да) = {0, 1}
8. Наличие GPRS(0 – Нет, 1 – Да) = {0, 1}
9. Наличие WAP(0 – Нет, 1 – Да) = {0, 1}
10. Тип телефона (0 – Раскладной, 1 – Обычный) = {0, 1}
11. Наличие MP3-плеера (0 – Нет, 1 – Да) = {0, 1}
12. Цена = [1459, 10528]
2 Концептуализация предметной области
2.1 Извлечение знаний
2.1.1 Анализ методом главных компонент
Метод главных компонент даст возможность по pисходным признакам выделить в общем случаерглавных компонент
Введем исходные данные в электронную таблицу STATGRAPHICS (50x10) Исходная сводка анализа метода главных компонент (МГК) представлена в таблице 2.1.
Таблица 2.1
Исходная сводка МГК
Component Number |
Eigen Value |
Percent of Variance |
Cumulative Percentage |
1 |
4,86186 |
40,515 |
40,515 |
2 |
1,66796 |
13,900 |
54,415 |
3 |
1,27215 |
10,601 |
65,016 |
4 |
1,08364 |
9,030 |
74,047 |
5 |
0,791021 |
6,592 |
80,639 |
6 |
0,652707 |
5,439 |
86,078 |
7 |
0,566364 |
4,720 |
90,798 |
8 |
0,401443 |
3,345 |
94,143 |
9 |
0,321279 |
2,677 |
96,820 |
10 |
0,186327 |
1,553 |
98,373 |
11 |
0,125701 |
1,048 |
99,420 |
12 |
0,0695471 |
0,580 |
100,000 |
Number of complete cases : 50 |
Из полученной сводки заключаем, что анализу подвергаются переменные наличие Bluetooth, наличиеGPRS, наличиеMP3 - плеера, наличиеWAP, тип антенны , вес, тип телефона, время работы в режиме ожидания, время работы в режиме разговора, наличие ф/камера, количество цветов, цена и что число объектов составляет 50
Далее следует информация непосредственно МГК собственные значения главных компонент, упорядоченные по величине (Eigenvalue), процент дисперсии, приходящийся на каждую выделенную главную компоненту (Percent of Variance), накопленный процент дисперсии (Cumulative Percentage).
Приведенные цифры говорят о том, что уже первые две главные компоненты описывают 54,415% дисперсии исходных данных. Третья главная компонента добавляет еще 10,601% дисперсии, так что в сумме получается 65,016% дисперсии.
Для более детального анализа проделали еще ряд операций. Получили веса признаков в главных компонентах (таблица 2.2).
Таблица 2.2
Веса признаков в главных компонентах
|
Component1 |
Component2 |
Component3 |
Bluetooth |
0,334148 |
-0,374768 |
0,21898 |
GPRS |
0,337873 |
0,257294 |
-0,373486 |
MP3 |
0,237808 |
-0,154475 |
0,352494 |
WAP |
0,3270018 |
0,268691 |
-0,417674 |
Антенна |
0,117449 |
0,503034 |
0,257532 |
Вес |
0,292611 |
-0,240459 |
-0,110697 |
Тип телефона |
0,129056 |
0,494875 |
0,349526 |
Время работы в режиме ожидания |
-0,280712 |
-0,219816 |
-0,123635 |
Время работы в режиме разговора |
-0,205463 |
-0,0990527 |
0,326759 |
Ф/камера |
0,35334 |
-0,162447 |
-0,104424 |
Кол-во цветов |
0,320569 |
0,00354764 |
-0,424314 |
Цена |
0,382093 |
-0,238733 |
-0,0101488 |
Как следует из полученных цифр, в первой компоненте наблюдается наибольшая прямопропорциональная зависимость от цены, наличия Bluetooth, наличияGPRS, наличияWAP, наличия ф/камеры, количества цветов дисплея и веса телефона . Во второй главной компоненте наблюдается обратнопропорциональная зависимость от наличияBluetooth, и прямопропорциональная зависимость от наличияGPRS, наличияWAP, типа антенны и типа телефона. В третьей главной компоненте наибольшая обратнопропорциональная зависимость от наличияWAPиGPRS, а также прямопропорциональная зависимость от количества цветов дисплея, наличияMP3, типа телефона, время работы в режиме разговора.
Перейдем к рассмотрению диаграммы рассеивания всей совокупности мобильных телефонов на плоскости выделенных двух главных компонент (рисунок 2.1).
Рисунок 2.1 – Проекция исследуемых телефонов на пространство двух ГК
На представленном рисунке хорошо видно, что вся исследуемая совокупность телефонов разделилась на три достаточно четких класса.
Рисунок 2.2 – Проекция исследуемых телефонов на пространство трех ГК
Выбор значащих компонент и определение названия для них представлено ниже.
1) Выберем p=3 главных компонент.
2) Определим названия для них по формуле:
,
где [wkj] – подмножество участвующих в названии весовых коэффициентовj-й компоненты;
[wj] – все весовые коэффициентыj-й компоненты.
0,334148 |
-0,374768 |
0,21898 | |
0,337873 |
0,257294 |
-0,373486 | |
0,237808 |
-0,154475 |
0,352494 | |
0,3270018 |
0,268691 |
-0,417674 | |
0,117449 |
0,503034 |
0,257532 | |
0,292611 |
-0,240459 |
-0,110697 | |
0,129056 |
0,494875 |
0,349526 | |
-0,280712 |
-0,219816 |
-0,123635 | |
-0,205463 |
-0,0990527 |
0,326759 | |
0,35334 |
-0,162447 |
-0,104424 | |
0,320569 |
0,00354764 |
0,424314 | |
0,382093 |
-0,238733 |
-0,0101488 |
Для первой компоненты имеем:
Т.к. принадлежит интервалу [0,75; 0,95], значит, первая главная компонента определяется (более чем на 79,1%) следующими показателями: цены, наличияBluetooth, наличияGPRS, наличияWAP, наличия ф/камеры, количества цветов дисплея и веса телефона
Для второй компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, вторая главная компонента определяется (более чем на 77,6%) следующими показателями: наличиеBluetooth, наличиеGPRS, наличиеWAP, тип антенны, типа телефона
Для третьей компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, третья главная компонента определяется (более чем на 84,7%) следующими показателями: наличиеWAP, количество цветов дисплея, наличиеGPRS, наличиеWAP, наличиеMP3, тип телефона, время работы в режиме разговора.
Характеристика классов относительно компонент представлена в таблице 2.3.
Таблица 2.3
Характеристика классов относительно компонент
Класс |
Значение компоненты | ||
Компонента 1 |
Компонента 2 |
Компонента 3 | |
1 |
низкое |
низкое |
высокое |
2 |
высокое |
низкое |
среднее |
3 |
высокое |
среднее |
высокое |
Характеристика классов относительно признаков представлена в таблице 2.4.
Таблица 2.4.
Характеристика классов относительно признаков
Класс |
Значение признака | |||||
Bluetooth |
GPRS |
MP3 |
WAP |
Антенна |
Вес | |
1 |
низкое |
низкое |
низкое |
низкое |
низкое |
низкое |
2 |
низкое |
высокое |
низкое |
высокое |
среднее |
среднее |
3 |
высокое |
высокое |
среднее |
высокое |
среднее |
высокое |
|
Тип |
Режим ожидания |
Режим разговора |
Ф/камера |
Кол-во цветов |
Цена |
1 |
низкое |
высокое |
высокое |
низкое |
низкое |
низкое |
2 |
среднее |
среднее |
среднее |
среднее |
среднее |
среднее |
3 |
низкое |
низкое |
низкое |
высокое |
высокое |
высокое |