- •Введение
- •1 Идентификация проблемной области
- •1.1 Постановка задачи
- •1.2 Назначение эс
- •1.3 Класс эс по решаемой задаче
- •2 Концептуализация предметной области
- •2.1 Извлечение знаний
- •2.1.1 Анализ методом главных компонент
- •2.1.2 Кластерный анализ с помощью дендрограмм
- •2.1.3 Кластерный анализ с помощью Карт Кохонена
- •2.1.4 Построение деревьев решений
- •2.2 Структурирование проблемной области
- •3 Формализация базы знании
- •3.1 Краткий обзор модели представления знаний
- •3.2 Обоснование выбора модели представления знаний
- •3.3 Таблицы решений
- •3.4 Сеть вывода
- •4 База знаний
- •Заключение
- •Приложение а – Исходная выборка исследуемых видеокарт
- •Приложение б – Принадлежность наблюдений к классам
2.1.3 Кластерный анализ с помощью Карт Кохонена
Для решения задачи кластеризации использовались самоорганизующиеся карты Кохонена с применением нейросетевого пакета SOMap analyzer1.0.
Self-Organizing Maps(SOM) – это самоорганизующиеся структуры, основанные на нейросети Кохонена, которые представлены в виде двухмерной сетки, в узлах которой находятся нейроны.
Структура сети Кохонена представлена на рисунке 3.1. Сеть имеет 10 входов по количеству признаков, по которым ведется кластеризация, и 1 выход, который выдает номер кластера. Сеть однослойная (слой Кохонена). Каждый нейрон слоя Кохонена с помощью своих весовых коэффициентов запоминает координаты ядра кластера и отвечает за отнесение объектов к этому кластеру. Интерпретатор выбирает максимальное значение среди всех выходов и выдает номер этого выхода, который является номером кластера.
Рисунок 2.6 – Структура сети Кохонена
Выборка, состоящая из видеокарт в приложении А. То есть в качестве исходных данных взяты признаки: цена, частота и объем памяти, тип шины, разрядность шины памяти, тактовая частота чипа и другие показатели.
Процесс обучения сети состоит из 5 шагов: выбор источника данных; настройка полей; установка параметров обучения; установка параметров визуализации; обучение (построение) карты.
В качестве источника данных используем созданную обучающую выборку. Параметры обучения, параметры визуализации представлены на рисунке 3.2.
Рисунок 2.7 – Информация о карте
Для построения карт открываем окно с картами по обучающей выборке и выбираем нужные компоненты. Результаты построения представлены на рисунке 2.8 и 2.9.
Рисунок 2.8 – Карты по обучающей выборке
Рисунок 2.9 – Карты по обучающей выборке
В результате анализа карт было выявлено 3 кластера видеокарт:
Таблица 2.5
Характеристика кластеров по признакам
|
Кластер 1 |
Кластер 2 |
Кластер 3 |
Цена |
средний |
малый |
малый |
Объем памяти |
большой |
средний |
средний |
Тип шины |
средний |
средний |
средний |
Разрядность шины |
большой |
средний |
средний |
Частота чипа |
большой |
средний |
средний |
Частота памяти |
средний |
средний |
малый |
Наличие DVI |
большой |
большой |
большой |
Наличие SLI |
средний |
малый |
малый |
Наличие TVIn |
средний |
малый |
малый |
Наличие TVOut |
большой |
большой |
большой |
В таблице приведены значения признаков наиболее характерных для каждого из кластеров. Жирным шрифтом отмечены признаки определяющие принадлежность видеокарты к кластеру.
Статистика по каждому классу в отдельности представлена на следующих рисунках 2.10 – 2.12.
Рисунок 2.10 – Статистика по 1-ому кластеру |
Рисунок 2.11 – Статистика по 2-ому кластеру |
Рисунок 2.12 – Статистика по 3-ему кластеру |
Окно со статистикой показывает следующие статистические показатели:
минимальное значение;
максимальное значение;
среднее значение;
стандартное отклонение (дисперсия);
количество элементов.
На основе проведенного кластерного анализа можно извлечь следующие правила.
1. Если Цена = средняя И Частота памяти = средняя, то Кластер 1.
2. Если Цена = малая И Частота памяти = средняя, то Кластер 2.
3. Если Цена = малая И Частота памяти = малая, то Кластер 3.