Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовой проект - Интеллектуальный анализ рынка мобильных телефонов.doc
Скачиваний:
47
Добавлен:
02.05.2014
Размер:
1.6 Mб
Скачать

1 Идентификация проблемной области

1.1 Постановка задачи

Разработать ЭС, для применения ее в автоматизации отдела продаж магазина мобильных телефонов. Данная программа позволяет классифицировать телефоны по нескольким признакам.

1.2 Назначение эс

Назначение ЭС − консультирование в области принятия решений и формиро­вание списка мобильных телефонов из каталога, которые соответствуют требованиям покупателя.

Особенности решения задачи связаны с тем, что ЭС настраивается на требо­вания и запросы пользователя. ЭС должна выполнять функции когнитолога, поддерживать интерфейс пользователя, а также хранить и пополнять БЗ в от­дельном файле. ЭС должна выдавать класс мобильного телефона.

Цель разработки ЭС - консультация сотрудников отдела продаж магазина в процессе обслуживания клиентов.

1.3 Класс эс по решаемой задаче

Класс решаемой задачи - задача классификации. ЭС позволяет сформировать несколько классов мобильных телефонов.

1.4 Цель

Цель − отнести мобильный телефон к какому-либо классу.

Целевая переменная "Класс" принимает следующие значения Класс = 1, Класс = 2, Класс = 3.

1.5 Ожидаемые результаты

Разработать ЭС, для применения ее в автоматизации отдела продаж компьютерного магазина. Сформировать множество возможных действий по мотивации покупателя в соответствии с заданными требованиями.

1.6 Промежуточные цели

Промежуточные цели при построении данной ЭС определяются такими пере­менными, как: Comp1 = большая, средняя, малая; Comp2 = большая, средняя, малая, Comp3 = большая, средняя, малая.

1.7 Исходные данные

Исходные данные при построении данной ЭС определяются такими переменными, как:

1. Время работы в режиме разговора = [2, 11]

2. Время работы в режиме ожидания = [80, 450]

3. Наличие Bluetooth (0 – Нет, 1 – Да) = {0, 1}

4. Количество цветов дисплея [1, 262144]

5. Вес = [88, 141]

6. Тип антенны = (0 – Внутренняя, 1 – Внешняя) = {0, 1}

7. Наличие фотокамеры = (0 – Нет, 1 – Да) = {0, 1}

8. Наличие GPRS(0 – Нет, 1 – Да) = {0, 1}

9. Наличие WAP(0 – Нет, 1 – Да) = {0, 1}

10. Тип телефона (0 – Раскладной, 1 – Обычный) = {0, 1}

11. Наличие MP3-плеера (0 – Нет, 1 – Да) = {0, 1}

12. Цена = [1459, 10528]

2 Концептуализация предметной области

2.1 Извлечение знаний

2.1.1 Анализ методом главных компонент

Метод главных компонент даст возможность по pисходным признакам вы­делить в общем случаерглавных компонент

Введем исходные данные в электронную таблицу STATGRAPHICS (50x10) Исходная сводка анализа метода главных компонент (МГК) представлена в таблице 2.1.

Таблица 2.1

Исходная сводка МГК

Component Number

Eigen Value

Percent of Variance

Cumulative Percentage

1

4,86186

40,515

40,515

2

1,66796

13,900

54,415

3

1,27215

10,601

65,016

4

1,08364

9,030

74,047

5

0,791021

6,592

80,639

6

0,652707

5,439

86,078

7

0,566364

4,720

90,798

8

0,401443

3,345

94,143

9

0,321279

2,677

96,820

10

0,186327

1,553

98,373

11

0,125701

1,048

99,420

12

0,0695471

0,580

100,000

Number of complete cases : 50

Из полученной сводки заключаем, что анализу подвергаются переменные наличие Bluetooth, наличиеGPRS, наличиеMP3 - плеера, наличиеWAP, тип антенны , вес, тип телефона, время работы в режиме ожидания, время работы в режиме разговора, наличие ф/камера, количество цветов, цена и что число объектов составляет 50

Далее следует информация непосредственно МГК собственные значения глав­ных компонент, упорядоченные по величине (Eigenvalue), процент дисперсии, приходящийся на каждую выделенную главную компоненту (Percent of Variance), накопленный процент дисперсии (Cumulative Percentage).

Приведенные цифры гово­рят о том, что уже первые две главные компоненты описывают 54,415% дисперсии исходных данных. Третья главная компонента добавляет еще 10,601% дисперсии, так что в сумме получается 65,016% дисперсии.

Для более детального анализа проделали еще ряд операций. Получили веса признаков в главных компонентах (таблица 2.2).

Таблица 2.2

Веса признаков в главных компонентах

Component1

Component2

Component3

Bluetooth

0,334148

-0,374768

0,21898

GPRS

0,337873

0,257294

-0,373486

MP3

0,237808

-0,154475

0,352494

WAP

0,3270018

0,268691

-0,417674

Антенна

0,117449

0,503034

0,257532

Вес

0,292611

-0,240459

-0,110697

Тип телефона

0,129056

0,494875

0,349526

Время работы в режиме ожидания

-0,280712

-0,219816

-0,123635

Время работы в режиме разговора

-0,205463

-0,0990527

0,326759

Ф/камера

0,35334

-0,162447

-0,104424

Кол-во цветов

0,320569

0,00354764

-0,424314

Цена

0,382093

-0,238733

-0,0101488

Как следует из полученных цифр, в первой компоненте наблюдается наибольшая прямопропорциональная зависимость от цены, наличия Bluetooth, наличияGPRS, наличияWAP, наличия ф/камеры, количества цветов дисплея и веса телефона . Во второй главной компоненте наблюдается обратнопропорциональная зависимость от наличияBluetooth, и прямопропорциональная зависимость от наличияGPRS, наличияWAP, типа антенны и типа телефона. В третьей главной компонен­те наибольшая обратнопропорциональная зависимость от наличияWAPиGPRS, а также прямопропорциональная зависимость от количества цветов дисплея, наличияMP3, типа телефона, время работы в режиме разговора.

Перейдем к рассмотрению диаграммы рассеивания всей совокупности мобильных телефонов на плоскости выделенных двух главных компонент (рисунок 2.1).

Рисунок 2.1 – Проекция исследуемых телефонов на пространство двух ГК

На представленном рисунке хорошо видно, что вся исследуемая совокупность телефонов разделилась на три достаточно четких класса.

Рисунок 2.2 – Проекция исследуемых телефонов на пространство трех ГК

Выбор значащих компонент и определение названия для них представлено ниже.

1) Выберем p=3 главных компонент.

2) Определим названия для них по формуле:

,

где [wkj] – подмножество участвующих в названии весовых коэффициентовj-й компоненты;

[wj] – все весовые коэффициентыj-й компоненты.

0,334148

-0,374768

0,21898

0,337873

0,257294

-0,373486

0,237808

-0,154475

0,352494

0,3270018

0,268691

-0,417674

0,117449

0,503034

0,257532

0,292611

-0,240459

-0,110697

0,129056

0,494875

0,349526

-0,280712

-0,219816

-0,123635

-0,205463

-0,0990527

0,326759

0,35334

-0,162447

-0,104424

0,320569

0,00354764

0,424314

0,382093

-0,238733

-0,0101488

Для первой компоненты имеем:

Т.к. принадлежит интервалу [0,75; 0,95], значит, первая главная компонента определяется (более чем на 79,1%) следующими показателями: цены, наличияBluetooth, наличияGPRS, наличияWAP, наличия ф/камеры, количества цветов дисплея и веса телефона

Для второй компоненты

Т.к. принадлежит интервалу [0,75; 0,95], значит, вторая главная компонента определяется (более чем на 77,6%) следующими показателями: наличиеBluetooth, наличиеGPRS, наличиеWAP, тип антенны, типа телефона

Для третьей компоненты

Т.к. принадлежит интервалу [0,75; 0,95], значит, третья главная компонента определяется (более чем на 84,7%) следующими показателями: наличиеWAP, количество цветов дисплея, наличиеGPRS, наличиеWAP, наличиеMP3, тип телефона, время работы в режиме разговора.

Характеристика классов относительно компонент представлена в таблице 2.3.

Таблица 2.3

Характеристика классов относительно компонент

Класс

Значение компоненты

Компонента 1

Компонента 2

Компонента 3

1

низкое

низкое

высокое

2

высокое

низкое

среднее

3

высокое

среднее

высокое

Характеристика классов относительно признаков представлена в таблице 2.4.

Таблица 2.4.

Характеристика классов относительно признаков

Класс

Значение признака

Bluetooth

GPRS

MP3

WAP

Антенна

Вес

1

низкое

низкое

низкое

низкое

низкое

низкое

2

низкое

высокое

низкое

высокое

среднее

среднее

3

высокое

высокое

среднее

высокое

среднее

высокое

Тип

Режим ожидания

Режим разговора

Ф/камера

Кол-во цветов

Цена

1

низкое

высокое

высокое

низкое

низкое

низкое

2

среднее

среднее

среднее

среднее

среднее

среднее

3

низкое

низкое

низкое

высокое

высокое

высокое