Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1393

.pdf
Скачиваний:
3
Добавлен:
07.01.2021
Размер:
1.11 Mб
Скачать

Впроцессе обучения сеть в определенном порядке просматривает обучающую выборку, порядок просмотра может быть последовательным, случайным и т.д., при этом один полный проход по выборкам называется эпохой обучения.

Топологическая карта представляет собой радиальный слой сети Кохонена, элементы которого располагаются на плоскости и обучаются таким образом, чтобы близкие кластеры данных соответствовали соседним элементам слоя. Она показывает, какие наблюдения отнесены к тому или иному кластеру и помогает пользователю правильно пометить элементы и наблюдения.

По мере работы алгоритма скорость обучения (которая определяет степень корректировки центров к обучающим наблюдениям) и размеры окрестности постепенно уменьшаются. Таким образом, на своих ранних стадиях алгоритм строит грубую топологическую карту,

вкоторой определенным областям радиального слоя соответствуют близкие кластеры наблюдений. На последующих этапах топологическая карта уточняется, так что небольшим кластерам похожих наблюдений соответствуют отдельные элементы.

Врезультате обучения сеть организуется таким образом, что элементы, соответствующие центрам, расположенным близко друг от друга в пространстве входов, будут располагаться близко друг от друга и на топологической карте. Топологический слой сети можно представлять себе как двумерную решетку, которую нужно так отобразить

вN-мерное пространство входов, чтобы по возможности сохранить исходную структуру данных. При любой попытке представить N- мерное пространство на плоскости будут потеряны многие детали; однако такой прием иногда полезен, так как он позволяет визуализировать данные, которые никаким иным способом понять невозможно.

Ширина и высота топологической карты определяются выходным слоем, который отображается в двух измерениях.

Отображение на топологической карте «Неизвестно» означает то, что введенное данное не относится ни к одному из имеющихся нейронов и создается новый нейрон на карте, описывающий это введенное данное.

Для вывода об относительной важности входных переменных для конкретной нейронной сети и при необходимости удалить входы с низкими показателями чувствительности необходим Анализ. Анализ чувствительности можно использовать с чисто информационными целями или чтобы произвести удаление входов.

20

Анализ чувствительности позволяет выделить ключевые переменные, без которых анализ невозможен, и идентифицировать те, которые можно без ущерба исключить из рассмотрения.

В общем случае входные переменные не являются независимыми. Анализ чувствительности располагает их в том порядке, который соответствует степени ухудшения качества модели при исключении из нее соответствующей переменной. При этом каждой переменной присваивается определенный рейтинг. Однако при наличии зависимостей между входными переменными одиночный рейтинг не всегда правильно отражает реальную ситуацию.

Низкий показатель чувствительности может быть присвоен переменной, которая является ключевой, и высокую чувствительность может иметь одна не очень существенная переменная по сравнению с комбинацией других переменных, которые в совокупности содержат важную информацию.

Некоторые взаимозависимые переменные могут быть полезны только тогда, когда они представлены в совокупности. Если такой набор включить в модель целиком, то для всех этих переменных будут получены высокие показатели чувствительности, что, тем не менее, не позволит выявить зависимости. Гораздо хуже, если в модель включена только часть набора зависимых переменных, при этом показатели чувствительности будут близки к нулю, как будто эти переменные не содержат никакой важной информации.

Анализ чувствительности не позволяет надежно определить «полезность» переменных в абсолютной шкале, и все выводы об их важности нужно делать с осторожностью. Тем не менее, эта процедура оказывается чрезвычайно полезной на практике. Если исследуется целый ряд моделей, то имеет смысл выделить ключевые переменные, которые всегда важны и имеют высокий показатель чувствительности, определить переменные с низкой чувствительностью и получить информацию о «сомнительных» переменных, которые меняют свой рейтинг и, возможно, содержат избыточную информацию.

Генетический алгоритм является алгоритмом поиска оптимальной битовой строки, который случайным образом выбирает начальную популяцию таких строк и затем подвергает их процессу искусственных мутаций,скрещиванияиотборапоаналогиисестественнымотбором.

Область применения генетических алгоритмов лежит в основе решения разнообразных оптимизационных задач, возникающих в экономике, бизнесе, промышленности и других областях человечес-

21

кой деятельности [8].

В программе SNN генетический алгоритм применяется для обеспечения работы ИНС, целью которого является улучшение или анализ функционирования сети, а именно:

для подбора параметров либо преобразования пространства параметров, использованных ИНС для классификации;

для подбора правила обучения либо параметров, управляющих обучением ИНС;

для анализа ИНС.

Алгоритм работы генетического алгоритма и ИНС выглядит следующим образом:

Задача ИНС Данные (наблюдения) Генетический алгоритм решение ИЛИ Задача Генетический алгоритм Дан-

ные (наблюдения) ИНС решение Сеть для кластеризации состоит из множества векторов образ-

цов, отмеченных классами (каждый вектор представлен радиальным нейроном). С помощью алгоритмов кластеризации, таких как К- Средних, векторы приписываются к центрам и затем отмечаются, используя ближайшие наблюдения. После отметки координаты центров могут быть точно откорректированы с помощью Обучающегося векторного квантователя. Метод К-Средних позволяет исключить дублирование динамичных наблюдений [9].

4. РЕКОМЕНДУЕМЫЕ ЛАБОРАТОРНЫЕ РАБОТЫ

Для изучения работы программного пакета SNN и выполнения практических заданий в пакете SNN введены дополнительные файлы Вентилятор.stw и Вуз.sta, представляющие собой общие таблицы с данными параметров и составляющие базу данных лабораторных работ № 1-6. Файл Вентилятор.stw содержит переменные «температура», «скорость вращения вентилятора», «класс».

Лабораторная работа № 1 ЗНАКОМСТВО С СОВРЕМЕННЫМ НЕЙРОСЕТЕВЫМ ПРОГРАММНЫМ ПРОДУКТОМ STATISTICA NEURAL

NETWORKS (SNN) ВЕРСИИ «SNN 7.0»

Цель работы – познакомиться с программным продуктом Statistica Neural Networks (SNN), построить нейронную сеть с помощью мастера решений.

22

Порядок работы

1.Открыть файл данных Вентилятор.stw (табл.П.1) с помощью команды Файл Открыть. В этом файле находятся данные о двух типах классах – 1 и 2, наличие и отсутствие перегрева.

2.Выбрать команду Нейронные сети в меню Анализ для вызова стартовой панели STATISTICA Нейронные сети.

Рис. 4. Выбор инструмента

3.На вкладке Быстрый стартовой панели Нейронные сети выбрать из списка тип задачи (в данном случае – Классификация) и метод решения (в данном случае – Мастер решений) и нажать кнопку OK (рис. 4). После этого будет отображен стандартный диалог выбора переменных.

4.Выбрать зависимую (выходную) переменную (в данном случае – переменная КЛАСС) (рис. 5).

Рис. 5. Входные данные

23

5.Для отображения Мастера решений нажать кнопку OK на стартовой панели.

На вкладке Быстрый (рис. 6) отменить выбор опции Выбрать подмножество независимых переменных, здесь определены только две независимые переменные, таким образом, обе переменные будут использоваться в качестве входов для всех проверяемых нейронных сетей. В группе Длительность анализа находятся опции, определяющие время, которое Мастер решений потратит на поиск эффективной нейронной сети. Чем дольше Мастер решений будет работать, тем эффективней будет найденное решение. Например, установить 25 сетей.

По результату проведенного анализа можно сохранить нейронные сети различных типов с различными показателями производительности и сложности для того, чтобы можно было в итоге выбрать наилучшую сеть самостоятельно.

6.Ввести число 10 для сохранения сетей, чтобы Мастер решений сохранил только 10 наилучших вариантов сетей.

Вкладка Мастер решений Быстрый будет иметь вид, отображенный на рис. 6.

Рис. 6. Настройки для проведения анализа

24

Нажать кнопку OK, чтобы Мастер решений начал построение нейронных сетей. После этого будет отображен диалог Идет обучение (Мастер решений). Каждый раз при обнаружении улучшенной нейронной сети будет добавлена новая строка в информационную таблицу. Кроме этого, в нижней части окна отображается время работы и процент выполненного задания. Если на протяжении длительного времени не произошло никаких улучшений, то нажать кнопку Готово в диалоге Идет обучение, чтобы завершить процесс поиска сетей. После окончания поиска будет отображен диалог Результаты, содержащий информацию о найденных сетях для дальнейшего анализа (рис. 7).

Рис. 7. Результаты обучения

7. Нажать кнопку Описательные стат. на вкладке Быстрый в

диалоге Результаты, чтобы отобразить две итоговые таблицы: Классификация и Матрица ошибок.

В таблице классификаций (рис. 8) представлена полная информация о решении соответствующей задачи. В этой таблице для каждого выходного класса, предсказанной каждой моделью, существует не-

25

сколько столбцов. Например, столбец, обозначенный КЛАСС.1.11, соответствует предсказаниям модели 1 в классе ПЕРЕГРЕВА для переменной КЛАСС. В первой строке приводится информация о количестве наблюдений различных типов перегревов в файле данных. Во второй (третьей) строке отображаются данные (для каждого класса) о количестве правильно (неправильно) классифицированных наблюдений. В четвертой строке приводятся «неизвестные» наблюдения. Матрица ошибок обычно используется в задачах с несколькими выходными классами.

8. Для отображения итоговой статистики необходимо открыть

Анализ (кнопка Результаты в строке Анализа или команда Продолжить в меню Анализ). В группе Выборки для вывода результа-

тов выбрать опцию Все (отдельно). Затем нажать кнопку Описательные статистики. Итоговая таблица классификаций разделена на четыре части. Заголовки столбцов имеют различные префиксы: О, К, Т и И, которые соответствуют обучающей, контрольной, тестовой и игнорируемой выборкам соответственно. По умолчанию, наблюдения разделены на три подмножества в отношении 2:1:1. Таким образом, выделено 50 обучающих наблюдений, 25 контрольных наблюдений и 25 проверочных наблюдений. Результаты работы нейронной сети на этих множествах практически совпадают, то есть качество нейронной сети можно считать приемлемым.

Рис. 8. Таблица классификаций

9. Для завершения Анализа нажать кнопку OK в диалоге Результаты. На стартовой панели при нажатии на кнопку Отмена все построенные нейронные сети будут удалены. Сохранять нейронные сети необходимо для того, чтобы быстрее провести обучение нейронных сетей, соответственно перед этим найти сеть с наилучшей производительностью, и далее построенные нейронные сети сохраняются для

26

дальнейшего использования. Для сохранения нейронной сети выбрать вкладку Сети/Ансамбли и нажать кнопку Сохранить файл сети как.... (файл имеет расширение .snn).

Задания

1.Построить и обучить нейронную сеть с помощью Мастера решений для автоматизации диагностики автомобиля, определяющей необходимость капитального ремонта двигателя на основе следующих параметров: компрессия двигателя, давление масла, расход бензина.

2.Ввести исходные данные в соответствии с табл. 1, конкретные значения переменных получить у преподавателя.

3.Построить нейронную сеть в соответствии с настройками:

тип задачи: классификация;

инструмент: мастер решений;

количество сетей: 25;

сохранять сетей: 10.

4.Сохранить нейронные сети различных типов с разными показателями производительности и сложности. Определить наилучшую сеть.

5.Сделать анализ построения нейронной сети и отразить в отчете.

6.Оформить отчет о выполненной работе.

Таблица 1

Основные данные для определения необходимости капитального ремонта автомобиля

Номер на-

Давление

Расход бензина,

Компрессия двигате-

 

масла,

ля,

Вывод

блюдения

% от нормы

кгс/см2

кгс/ см2

 

1

0.84-0.91

105

10.3

Не треб.

2

0.56-0.85

127

10.2

Не треб.

3

0.33-0.55

144

9.5

Кап.рем.

4

0.24-0.46

141

10.7

Кап.рем.

5

0.23-0.44

113

9.8

Не треб.

6

0.18-0.79

139

9.4

Кап.рем.

7

0.67-0.84

112

10.1

Не треб.

8

0.75-0.90

140

9.5

Кап.рем.

Контрольные вопросы

1.Какие требования предъявляются к параметрам базы данных для построения нейронной сети в программе?

2.Могут ли в базе данных содержаться переменные с приближен-

27

ными параметрами наблюдений? Почему?

3.Какая существует зависимость между количеством наблюдений

иколичеством параметров?

4.Назовите свойства Мастера решений и Конструктора сетей

для проектирования сети.

5.Назовите условия выбора типа сети.

6.Что такое длительность анализа?

7.Каким образом определяются входные и выходные параметры?

8.Какой ожидаемый результат после обучения? От чего он зави-

сит?

9.Что такое выборки?

10.Назначение выборок.

Лабораторная работа №2

ТЕСТИРОВАНИЕ НЕЙРОСЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ

Цель работы – построить, обучить и провести тестирование нейросети для решения задачи классификации, а также определить зависимость результатов предсказаний от длительности анализа при построении и обучении нейронной сети.

Порядок работы

1.Открыть файл данных Вентилятор.stw (см.табл.П.1). В этом файле находятся данные о двух типах классах – 1 и 2, наличие и отсутствие перегрева.

2.Выбрать команду Нейронные сети в меню Анализ для вызова стартовой панели STATISTICA Нейронные сети.

3.На вкладке Быстрый стартовой панели Нейронные сети выбрать из списка тип задачи (в данном случае – Классификация) и метод решения (в данном случае – Мастер решений) и нажать кнопку

OK.

4.После этого будет отображен стандартный диалог выбора переменных.

Выбрать зависимую (выходную) переменную (в данном случае – переменная КЛАСС, которая содержит коды для двух типов перегрева) и затем независимые переменные (в данном случае – переменные ТЕМПЕРАТУРА и СКОРОСТЬ, которые содержат данные о температуре и скорости вращения вентилятора).

28

5.Нажать кнопку OK на стартовой панели для отображения диа-

лога Мастер решений.

6.На вкладке Быстрый нужно отменить выбор опции Выбрать подмножество независимых переменных, так как определены толь ко две независимые переменные. Таким образом, обе переменные будут использоваться в качестве входов для всех проверяемых нейронных сетей. В группе Длительность анализа находятся опции, определяющие время, которое Мастер решений потратит на поиск эффективной нейронной сети. Чем дольше Мастер решений будет работать, тем эффективней будет найденное решение. Можно ограничить время работы в терминах количество создаваемых и проверяемых нейронных сетей (опция N сетей) или точно указать время работы (опция Часы/минуты). Для решения текущей задачи в опции N сетей необходимо указать число итераций, равное 25. Мастер решений может исследовать очень большое количество нейронных сетей. Обычно рекомендуется изучить несколько наилучших вариантов сетей.

Таким образом, можно сравнить производительность нескольких различных типов нейронных сетей, поскольку некоторые сети могут иметь меньшую производительность, но им стоит отдать предпочтение по другим причинам (например, меньший размер или меньшее число входов). По умолчанию, программа сохраняет нейронные сети различных типов с различными показателями производительности и сложности для того, чтобы можно было в итоге выбрать наилучшую сеть самостоятельно.

7.Ввести число 10 для сохранения сетей, чтобы Мастер решений сохранил только 10 наилучших вариантов сетей.

Теперь нажать кнопку OK, чтобы Мастер решений начал построение нейронных сетей. После этого будет отображен диалог Идет обучение (Мастер решений). Каждый раз при обнаружении улучшенной нейронной сети будет добавлена новая строка в информационную таблицу. Кроме этого, в нижней части окна отображается время работы и процент выполненного задания. Если на протяжении длительного времени не произошло никаких улучшений, то можно нажать кнопку Готово в диалоге Идет обучение, чтобы завершить процесс поиска сетей.

8.После окончания поиска будет отображен диалог Результаты, который содержит информацию о найденных сетях и предоставляет функции для дальнейшего анализа.

29

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]