Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическое моделирование / Arz_Zen_(2010)_Artificial_Intellegence.pdf
Скачиваний:
69
Добавлен:
20.03.2016
Размер:
7.31 Mб
Скачать

MSE – среднеквадратичная ошибка и ME – максимальная ошибка при настройке и при контроле) и веса связей нейронной сети для каждого шага процедуры регуляризации.

Рис. 3.12. Окно информации о результатах упрощения сети

Шаг 9. Коррекция решения. Выбрать в меню пункт

Run|Tuning|Correcting weights of existing links. Программа корректирует параметры нейронной сети с целью более качественной минимизации в метрическом пространстве с метрикой, выбранной в пункте меню Run|Parameters|Metrics. Численная минимизация ведется методом, обозначенным в пункте меню Run|Parameters|Algo-rithm. Перед коррекцией параметров нейронной сети проводится анализ ее связей, аналогичный вышеописанному анализу. В процессе минимизации на мониторе появляется окно, показанное на рис. 3.11. После окончания коррекции весов на диске создается файл с расширением *.txt. В этом файле содержится информация о времени настройки, количестве тактов работы, используемом алгоритме. Также в нем приводится таблица фактических и вычисленных нейронной сетью значений и, если включен признак робастности модели, вес каждого наблюдения, с которым оно входило в процесс обучения. В конце файла расположена информация о качестве модели (R2 – квадрат парного коэффициента корреляции, MAE – средняя абсолютная ошибка, MSE – среднеквадратичная ошибка и ME – максимальная ошибка при настройке). Такой файл создается на каждой итерации поиска глобального минимума и на каждой итерации процедуры скользящего контроля.

Шаг 10. Эксплуатация настроенной нейронной сети. Выбрать в меню пункт Run|Run|Run mode. При входе в этот режим программа автоматически переходит в окно с матрицей наблюдений и устанавливается в первый свободный ряд ниже матрицы наблюдений. В этом режиме можно вводить новую информацию в строки матрицы наблюдений ниже тех строк, на основании которых проводилось обучение нейронной сети. Остальные клетки становятся недоступными для модификации. Вносить новую информацию наиболее удобно через буфер обмена. В этом режиме во втором поле строки состояния сообщение "Modified" не появляется. Все

180

функции, связанные с модификацией, открытием и сохранением файлов являются недоступными. Также отключаются функции, связанные с настройкой и коррекцией параметров нейронной сети. После введения новой информации следует выбрать в меню пункт Run|Run|Run. Программа автоматически найдет модельные значения для всех строк, отображающихся в окне с матрицей наблюдений. В окне появляется дополнительный столбец с заголовком "Model value", в котором отображаются рассчитанные нейронной сетью значения. В случае включенных переключателей проводится предварительный анализ выборки и вновь введенных данных на наличие больших отклонений. Информацию можно скопировать в буфер обмена и перенести для анализа в любое приложение Windows. При переключении в другое окно дополнительный столбец исчезает. При выходе из режима "Run mode" (повторный выбор в меню пункта Run|Run|Run mode) вся вновь введенная информация исчезает.

Вопросы для самопроверки

1.Какие действия необходимо выполнить для определения структуры ИНС в программе NNC?

2.Каким образом может быть подготовлена матрица данных для обучения сети (обучающая последовательность)? Какими свойствами она должна обладать?

3.Охарактеризуйте различные алгоритмы обучения сети по методам: покоординатного спуска, случайного поиска, градиентному методу. Эти вопросы ранее изучались Вами в курсе «Численные методы».

181

3.2. Лабораторная работа 2.

Восстановление внутренней структуры объекта аддитивного типа по обучающей выборке с помощью ИНС-модели

Цели работы: 1) научиться основным технологическим приемам работы с искусственной нейронной сетью NNC на примере ее обучения по псевдоэкспериментальным данным, полученным для объекта аддитивного типа; 2) убедиться в хорошей обучаемости искусственной нейронной сети на основе эмпирических данных; 3) убедиться в возможности использования аппарата ИНС для восстановления внутренней структуры объекта аддитивного типа по обучающей выборке в случае полностью детерминированного и частично зашумленного объектов.

Порядок выполнения работы

1. Задать аддитивную функцию вида:

5

 

Y = a0 + ai Xi ,

(3.1)

i=1

где a1, a2, a3, a4, a5 – коэффициенты, значения которых необходимо выбрать индивидуально, так, чтобы 10 ai 10, i = 1,.., 5. Значения коэффициентов ai , i = 1 , . . , 5 необходимо запомнить или записать. Заданная функция соответствует детерминированному объекту аддитивного типа

(рис. 3.13).

Рис. 3.13. Структурная схема объекта

2.Составить программу для записи в файл обучающей выборки,

включающей не менее 50 строк. Переменные X1, X2, X3, X4, X5 должны изменяться случайным образом в диапазоне от –10 до 10. Значение Y должно вычисляться по уравнению (3.1).

3.Создать структуру (макет) искусственной нейронной сети в программе NNC.

4.Импортировать данные обучающей выборки посредством Microsoft Excel в программу NNC.

182

5.Осуществить обучение ИНС? изменяя активационные функции нейрона(ов), методы обучения и сравнивая результаты обучения.

6.Используя таблицу коэффициентов синаптической связи, установить восстановленный вид аддитивной функции и сравнить его с заданным.

7.Сделать выводы об обучаемости ИНС и возможности ее использования для восстановления структуры объектов аддитивного типа в детерминированных условиях.

8.Повторить работу в условиях зашумленности переменной Y (рис. 3.14). Принять, что максимальный уровень шума δ может составлять не более 10 % от уровня Y, а закон распределения случайной помехи δ – равномерный.

Рис. 3.14. Структурная схема объекта при условии наложения случайной ошибки на Y.

9. Сделать выводы об обучаемости ИНС и возможности ее использования для восстановления структуры объектов аддитивного типа при наличии шумов на выходе.

Отчет о работе, оформленный в виде файла в Microsoft Word, должен содержать: постановку задачи (объект с известным числом входов и выходов и уравнение связи вида (3.1)), обучающую последовательность, апробированные варианты структуры сети и результаты ее обучения (средняя абсолютная погрешность), восстановленное уравнение связи и сравнение его с уравнением (3.1) для детерминированного и зашумленного объектов.

Вопросы для самопроверки

1.Как выбрать структуру сети, соответствующую данной проблеме?

2.Какова относительная погрешность восстановленных коэффициентов уравнения (3.1) по отношению к их истинным значениям для детерминированного и зашумленного объектов?

3.Какова погрешность расчетов по ИНС-модели за пределами области входных переменных, покрытой обучающей выборкой? Объяснить полученный результат.

183

3.3. Лабораторная работа 3.

Восстановление внутренней структуры объекта мультипликативного типа по обучающей выборке с помощью ИНС-модели

Цели работы: 1) научиться основным технологическим приемам работы с искусственной нейронной сетью NNC на примере ее обучения по псевдоэкспериментальным данным, полученным для объекта мультипликативного типа; 2) освоить технологию выбора структуры ИНС; 3) убедиться в хорошей обучаемости искусственной нейронной сети на основе эмпирических данных; 4) убедиться в возможности использования аппарата ИНС для восстановления внутренней структуры объекта мультипликативного типа по обучающей выборке в случае полностью детерминированного и частично зашумленного объектов.

Порядок выполнения работы

1. Задать мультипликативную функцию вида:

Y = kX1X 2 ,

(3.2)

где k – коэффициент, значения которого необходимо выбрать индивидуально, так, чтобы 10 k 10. Значения коэффициента k необходимо запомнить или записать. Заданная функция соответствует детерминированному объекту мультипликативного типа (рис. 3.15).

Рис. 3.15. Структурная схема объекта

2.Составить программу для записи в файл обучающей выборки,

включающей не менее 50 строк. Переменные X1, X2 должны изменяться случайным образом в диапазоне от –10 до 10. Значение Y должно вычисляться по уравнению (3.2).

3.Создать структуру (макет) искусственной нейронной сети в программе NNC.

4.Импортировать данные обучающей выборки посредством Microsoft Excel в программу NNC.

5.Осуществить обучение ИНС изменяя активационные функции нейрона(ов) и сравнивая результаты обучения.

184

6.Используя алгоритм изменения (наращивания) структуры сети (подробно рассмотрен в лекциях), добиться приемлемой обучаемости ИНС.

7.Используя таблицу коэффициентов синаптической связи, установить восстановленный вид мультипликативной функции и сравнить его с заданным.

8.Сделать выводы об обучаемости ИНС и возможности ее использования для восстановления структуры объектов мультпликативного типа в детерминированных условиях.

9.Повторить работу в условиях зашумленности переменной Y (рис. 3.16). Принять, что максимальный уровень шума δ может составлять не более 10 % от уровня Y, а закон распределения случайной помехи δ – равномерный.

Рис. 3.16. Структурная схема объекта при условии наложения случайной ошибки на Y

10. Сделать выводы об обучаемости ИНС и возможности ее использования для восстановления структуры объектов мультипликативного типа при наличии шумов на выходе.

Отчет о работе, оформленный в виде файла в Microsoft Word, должен содержать: постановку задачи (объект с известным числом входов и выходов и уравнение связи вида (3.2)), обучающую последовательность, апробированные варианты структуры сети и результаты ее обучения (средняя абсолютная погрешность), восстановленное уравнение связи и сравнение его с уравнением (3.2) для детерминированного и зашумленного объектов.

Вопросы для самопроверки

1.Как выбирается структура сети, соответствующая данной проблеме?

2.Какова погрешность расчетов по ИНС-модели за пределами области входных переменных, покрытой обучающей выборкой? Объяснить полученный результат.

185

3.4. Лабораторная работа 4.

Построение ИНС-модели и прогнозирование временного ряда (случай одного наблюдаемого базового фактора)

Цели работы: 1) научиться строить ИНС-модели по временным рядам, представляющим собой изменения базового фактора; 2) убедиться в возможности использования аппарата ИНС для прогнозирования значений данных временных рядов.

Введение. Многие экономические, социальные и другие процессы описываются эмпирическими временными функциями. Во многих случаях бывает важно делать прогнозы значений таких функции на будущий период по результатам наблюдений за определенный период времени. Часто ситуация усложняется еще и тем, что измерения самого базового фактора производятся с определенной погрешностью, которая накладывает шум на временной ряд.

Порядок выполнения работы

1)Используя программу Microsoft Excel, сгенерировать два одно-

мерных массива – для детерминированного случая: Xi=A sin(ωti+ϕ), t0=0, ti=0,1 i, i=1,2,..,200; и частично зашумленного случая: Yi=A sin(ωti+ϕ)+δ(ti), t0=0, ti=0,1 i, i=1,2,..200, где δ(t) генерирует случайное число, равномерно распределенное в диапазоне от –1 до 1 (рис. 3.17). Значения A, ω и ϕ необходимо выбрать самостоятельно. Поскольку речь идет о временных рядах, то для дальнейшей работы нам потребуются лишь массивы Xi и Yi , i=1, 2,..,

200.Время в этом случае может быть выражено через число шагов (шаг равен 0,1).

2)Подготовить матрицы для обучения ИНС следующего вида (см.

табл. 3.1, 3.2):

Таблица 3.1

Обучающая последовательность для детерминированного объекта

 

Входы

 

 

Выход

X1

X2

 

..

Xm

Xk

X2

X3

 

..

Xm+1

Xk+1

X3

X4

 

..

Xm+2

Xk+2

:

:

 

:

:

:

Xn–m+1

Xn–m+2

 

..

Xn

Xk+n-m+1

186

 

 

 

 

 

Таблица 3.2.

Обучающая последовательность для зашумленного объекта

 

 

 

 

 

 

 

 

 

Входы

 

Выход

Y1

Y2

 

..

Ym

Yk

 

Y2

Y3

 

..

Ym+1

Yk+1

 

Y3

Y4

 

..

Ym+2

Yk+2

 

:

:

 

:

:

:

 

Yn-m+1

Yn-m+2

 

..

Yn

Yk+n-m+1

 

где, k – дальность прогноза (число шагов, на которые делается прогноз); n – число строк в обучающей выборке (в данной лабораторной работе можно принять n =150), m – число входов ИНС для прогноза. Дальность прогноза необходимо выбирать фиксированную – k=20 шагов; числом входов ИНС-модели необходимо варьировать m = 2, 3, 4, 5, 6 и выбрать оптимальное значение с точки зрения минимальной погрешности прогноза. Для формирования таблиц лучше написать вспомогательную программу.

3) Провести выбор структур ИНС для случаев детерминированной и зашумленной функций и m = 2, 3, 4, 5, 6. Провести обучение сетей на основе данных табл. 3.1 и 3.2.

Рис. 3.17. Пример детерминированной и зашумленной функций

187

4)По обученным ИНС-моделям сделать прогноз поведения Xi и Yi, 150 < i 200. Сделать сравнение с реальными значениями Xi и Yi в указанных точках и оценить относительную погрешность прогнозов.

5)Сделать выводы о качестве прогнозов во всех случаях.

Отчет о работе, оформленный в виде файла в Microsoft Word, должен содержать: постановку задачи, обучающие последовательности, апробированные варианты структур ИНС и результаты их обучения (максимальная относительная погрешность), графики, показывающие результаты прогноза X и Y и их сравнение с действительными значениями.

Вопросы для самопроверки

1.Какова погрешность обучения ИНС-модели для факторов X и Y?

2.Какова погрешность прогнозов по ИНС-моделям для детерминированного и зашумленного случаев?

188

3.5. Лабораторная работа 5.

Построение ИНС-модели и прогнозирование временного ряда (случай наблюдаемых базового и нескольких независимых факторов)

Цели работы: 1) научиться строить ИНС-модели по временным рядам, представляющим собой колебания базового и независимых факторов; 2) убедиться в возможности использования аппарата ИНС для прогнозирования значений временных рядов.

Введение. Многие экономические, социальные и др. процессы описываются функциями многих переменных вида Y=f(x), где Y представляет собой базовую переменную, а x – вектор независимых переменных. Для многих процессов Y и x могут быть представлены в виде временных рядов, представляющих собой результат наблюдений за ними на протяжении некоторого периода времени. Подобные временные ряды показаны на рис. 3.18, 3.19 для независимых переменных и на рис. 3.20 для базовой переменной. На практике бывает важно восстанавливать вид функции Y=f(x) по результатам наблюдений и делать прогноз Y по известным значениям для вектора x.

Замечание. При выполнении данной лабораторной работы можно использовать раздел 2.

Порядок выполнения работы

1)По данным рис. 3.18, 3.19 и 3.20 составить обучающую выборку для искусственной нейронной сети. При этом, необходимо использовать информацию только за первые 25 дней.

2)Осуществить выбор структуры сети и ее обучение по стандартному алгоритму последовательного наращивания числа нейронов в слое и числа внутренних слоев ИНС (см. раздел 1).

3)По обученной ИНС-модели сделать прогноз поведения фактора Y на последние 5 дней, базируясь на значениях независимых переменных за этот период.

4)Сравнить результаты прогноза на последние 5 дней месяца со значениями переменной Y, приведенными на рис. 3.20 и сделать выводы о качестве такого прогноза.

Отчет о работе, оформленный в виде файла в Microsoft Word, должен содержать: постановку задачи, обучающую последовательность, апробированные варианты структуры сети и результаты ее обучения (средняя абсолютная погрешность), восстановленное уравнение связи, результаты прогноза Y и их сравнение с действительными значениями, приведенными на рис. 3.20.

189

Рис. 3.18. Графики изменения значений 1-го, 2-го и 3-го независимых факторов в течение одного месяца

190

Рис. 3.19. Графики изменения значений 4-го, 5-го и 6-го независимых факторов в течение одного месяца

191

Рис. 3.20. Графики изменения значений базового (целевого) фактора в течение одного месяца

Вопросы для самопроверки

1.Какова погрешность вычисления базовой переменной Y, полученная в результате обучения сети (первые 25 дней).

2.Какова погрешность прогнозов по ИНС-модели за пределами области входных переменных (последние 5 дней)?

192

3.6. Лабораторная работа 6. Распознавание текстовой информации, представленной в виде изображения

Цель работы: убедиться в возможности использования аппарата ИНС для распознавания образов букв русского алфавита по их графическим изображениям.

Введение. Распознавание образов (pattern recognition) – это процесс анализа графических изображений и выделение их в определенный класс по отдельному отличительному признаку или совокупности признаков1.

Внастоящее время эта область является достаточно развитой, прежде всего благодаря решению проблемы распознавания текстовой информации, вводимой как графический образ. Современные программы распознавания текстовой информации работают достаточно надежно (например, FineReader). Однако, проблема распознавания рукописного текста в настоящее время окончательно не решена.

Вданной лабораторной работе предлагается изучить основные приемы распознавания букв русского алфавита с помощью аппарата ИНС.

Порядок выполнения работы

1. Выбрать 4–5 букв русского алфавита, значительно различающиеся

внаписании.

2.Создать на матрице (рис. 3.21) возможные образы представления выбранных букв; размер матрицы выбрать 5×6 элементов; нумерацию элементов выбрать в соответствии с рис. 3.21.

3.Сформировать обучающую матрицу в соответствии с рис. 3.22. Выбранные буквы обозначить соответственно цифрами 1, 2 и т. д.

4.Сформировать первичную структуру сети и сделать попытки ее обучения.

5.За счет изменения структуры ИНС добиться хорошей обучаемости

сети.

6.Предъявить нейронной сети образы букв, имеющиеся в таблице и убедиться в уверенной их идентификации.

7.Предъявить нейронной сети образы букв, содержащие по 1–2 ошибки, и убедиться в возможности их идентификации. Оценить максимальное число ошибок, при которых ИНС еще уверенно распознает буквы.

Отчет о работе, оформленный в виде файла в Microsoft Word, должен содержать: постановку задачи, обучающие последовательности, апробированные варианты структур ИНС и результаты их обучения (максимальная относительная погрешность), оценку максимального числа ошибок, при которых ИНС уверенно распознает буквы.

1 Першинов В. И., Савинков В. М. Толковый словарь по информатике. М.: Финансы и статистика. 1991. 543 с.

193

Рис. 3.21. Матрица для изображения образов букв

Рис. 3.22. Примеры пяти различных образов буквы «А» и образец матрицы входов, предназначенный для обучения искусственной нейронной сети

Вопросы для самопроверки

1.Как выбирается структура ИНС-модели для распознавания образов букв?

2.От чего зависит погрешность распознавания букв? Как можно повысить качество распознавания?

194

Литература к части 3

1.Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2004.

2.Барский А. Б. Нейронные сети: распознавание, управление, принятие решений. М.: Финансы и статистика, 2004.

3.Арзамасцев А. А., Зубаков А. П. Системы распознавания образов на основе аппарата искусственных нейронных сетей (ИНС): учеб. пособие. Тамбов: ИМФИ ТГУ им. Г. Р.Державина, 2003.

195

Учебное издание

Арзамасцев Александр Анатольевич Зенкова Наталья Александровна

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И РАСПОЗНАВАНИЕ ОБРАЗОВ

Учебное пособие

Печатается в авторской редакции

Компьютерное макетирование Т. Ю. Молчановой

Подписано в печать 22.11.2010 г. Формат 60×84/16. Бумага офсетная. Гарнитура «Таймс». Усл. печ. л. 11,39. Уч.-изд. л. 13,93.

Тираж 100 экз. Заказ 3183.

Издательский дом ТГУ имени Г. Р. Державина 392008, г. Тамбов, ул. Советская, 190г

196