Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовой проект - Интеллектуальный анализ рынка услуг платного хостинга.doc
Скачиваний:
35
Добавлен:
02.05.2014
Размер:
1.11 Mб
Скачать

2.1.3 Кластерный анализ с применением самоорганизующихся карт Кохонена.

Для решения задачи кластеризации использовались самоорганизующиеся карты Кохонена с применением нейросетевого пакета SOMap analyzer 1.0.

Self-Organizing Maps (SOM)– это самоорганизующиеся структуры, основанные на нейросети Кохонена, которые представлены в виде двухмерной сетки, в узлах которой находятся нейроны.

Структура сети Кохонена представлена на рисунке 2.6. Сеть имеет 7 входов по количеству признаков, по которым ведется кластеризация, и 1 выход, который выдает номер кластера. Сеть однослойная (слой Кохонена). Каждый нейрон слоя Кохонена с помощью своих весовых коэффициентов запоминает координаты ядра кластера и отвечает за отнесение объектов к этому кластеру. Интерпретатор выбирает максимальное значение среди всех выходов и выдает номер этого выхода, который является номером кластера.

Рисунок 2.6 – Структура сети Кохонена

Процесс обучения сети состоит из 5 шагов: выбор источника данных; настройка полей; установка параметров обучения; установка параметров визуализации; обучение (построение) карты.

В качестве источника данных используем созданную обучающую выборку. Параметры обучения, параметры визуализации представлены на рисунке 2.7.

Рисунок 2.7 – Информация о карте

Для построения карт открываем окно с картами по обучающей выборке и выбираем нужные компоненты. Результаты построения представлены на рисунке 2.8.

Рисунок 2.8 – Карты по обучающей выборке

В результате анализа карт было выявлено 3 кластера тарифов:

  1. Кластер характеризуется малым количеством ftpвходов, высоким количеством сервисов, малым объемом выделяемой памяти, низкой стоимостью, малым количеством виртуальных серверов, малым лимитом на трафик.

  2. Кластер характеризуется неограниченным количеством ftpвходов, высоким количеством сервисов, высоким объемом выделяемой памяти, высокой стоимостью, большим количеством виртуальных серверов, большим лимитом на трафик.

  3. Кластер высоким количеством ftpвходов, высоким количеством сервисов, средним объемом выделяемой памяти, средней стоимостью, малым количеством виртуальных серверов, неограниченным лимитом на трафик.

Статистика по каждому классу в отдельности представлена на следующих рисунках 2.9 – 2.11

Рисунок 2.9 – Статистика по 1-ому кластеру

Рисунок 2.10– Статистика по 2-ому кластеру

Рисунок 2.11 – Статистика по 3-ому

кластеру

Окно со статистикой показывает следующие статистические показатели:

  • минимальное значение;

  • максимальное значение;

  • среднее значение;

  • стандартное отклонение (дисперсия);

  • количество элементов.

На основе проведенного кластерного анализа можно извлечь следующие правила.

1. Если количество ftpвходов=малое, количество сервисов= высокое и объемом выделяемой памяти=малый и стоимость=низкая и количество виртуальных серверов= малое и лимит на трафик= малый,то Кластер 1

2. Если количество ftpвходов=неограниченное и количество сервисов= высокое и объем выделяемой памяти=высокий и стоимость= высокая и количество виртуальных серверов= большое и лимит на трафик= большой, то Кластер 2.

3. Если количество ftpвходов =высокое и количество сервисов= высокое и объемом выделяемой памяти=средний и стоимость = высокая и количество виртуальных серверов=малое и лимит на трафик=неограниченный, то Кластер 3.