Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Нечёткое, нейронное и гибридное управление

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
3.91 Mб
Скачать

Порог выключения i-го РЭ xвыкл i определяется выражением

xвыкл i mii C i C i .

Текущее значение выходного сигнала МРЭ определяется выражением

l

YBi ,

i 1

где l – число возбужденных уровней среди n уровней МПФ. Если принять

B1 B2 ,... Bl B,

то

Y lB.

Классическая реализация i-го РЭ выполнена на базе компаратора с отрицательной обратной связью для заданной ширины петли гистерезиса i .

Более интересный вариант построения МПФ активации представлен на базе одноуровневых ТУ с регулируемой петлей гистерезиса, включенных параллельно в канале обратной связи и смещенных относительно друг друга вправо / влево на равные / разные интервалы скважности выходного сигнала.

ТУ [35] аналогично триггеру Шмидта реализует релейную характеристику с регулируемой петлей гистерезиса и отличается от него импульсным входом. В зависимости от изменения скважностивходных импульсов ТУ формирует релейный сигнал. На рис. 2.6 приведены структурная схема МПФ с применением ТУ и его статическая характеристика, где характеристики i-х ТУ имеют равную ширину петли гистерезисаине смещеныотносительно друг друга[35].

141

Рис. 2.6. Статическая характеристика МПФ на базе ТУ

На вход компаратора МПФ активации поступает сигнал от генератора линейно изменяющегося напряжения (ГЛИН) и сигнал

рассогласования x0 x lB.

В зависимости от величины x0 компаратор формирует периодическую последовательность импульсов различной длительности. В зависимости от настройки скважности включения и выключения ТУ1,..., ТУn срабатывают один или несколько ТУ, формируя сигнал обратной связи lB и выход МПФ активации.

Из сравнительного анализа МПФ, реализованного на базе РЭ и ТУ, следует:

МПФ на базе РЭ имеет более простое аппаратное исполнение, чем МРЭ, реализованный на базе ТУ;

МПФ активации на базе ТУ имеет программную версию;

МПФ активации на базе РЭ и ТУ взаимозаменяемы, поэтому

целесообразно найти при условии В = C соответствие между МПФ активации, реализованными на базе ТУ и РЭ, которое представлено формулами, приведенными в табл. 2.2.

142

Таблица 2 . 2

Формулы соответствия МРЭ

Дано: Агл; 1i ;

4i

 

 

 

 

Дано: Агл; хi°;

i

 

 

 

 

 

 

 

 

 

Определить:

 

хi°; i

 

 

 

Определить: 1i ;

 

2i ;

3i ;

1i ;

4i

х

 

А

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

1i

 

 

i

 

 

 

 

 

i

 

 

1i

 

гл

 

 

 

 

Агл

 

 

 

 

 

 

 

2i

 

 

i

 

 

 

 

 

 

2Aгл

 

 

 

 

1i

 

1i

 

 

4i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3i

 

xi

 

 

3i

 

1i

 

 

 

 

 

 

 

 

2

 

 

 

 

 

2Aгл

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2i

1i 3i

1i

2i

3i

 

 

i 2Aгл 2i

4i

1i 1i

 

 

Многообразие статических характеристик МПФ активации позволяет существенно корректировать динамику САР с любым объектом. В зависимости от заданных входных параметров (см. табл. 2.2.) можно проектировать соответствующую статическую характеристику МПФ как с петлей гистерезиса, так и без нее. Применение «гибкого» МПФ активации в системах регулирования позволяет разрешить противоречие между максимальным быстродействием и избыточным управлением и существенно расширить границы области применения релейных систем для автоматизации линейных и нелинейных объектов.

МПФ имеет свойство изменять уровни переключения в зависимости от входного сигнала, что позволяет существенно корректировать параметры автоколебаний в релейной САР.

Рассмотрим другие функции активации (рис. 2.7).

Широко применяемой на практике является нелинейная функция с насыщением без смещения, так называемая логистическая функция или сигмоид, которую впервые предложил Мамдани:

f (x)

 

 

1

.

1

e x

 

 

143

С уменьшением параметра а сигмоид становится более пологим, в пределе при а = 0 вырождаясь в горизонтальную линию на уровне 0,5. При увеличении а сигмоид приближается по внешнему виду к функцииединичногоскачка с порогом Т в точке х = 0.

Рис. 2.7. Функции активации: а – пороговая асимметричная; б – пороговая симметричная; в – пороговая асимметричная с зоной нечувствительности; г – сигмоидная; д – гиперболический тангенс; е – линейная асимметричная; ж – линейная симментричная; з – линейная асимметричная с зоной нечувствительности; и – модифицированный гиперболический тангенс

144

Из формулы сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из ценных свойств сигмоидной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем.

f (x) f (x)(1 f (x)).

Следуетотметить, чтосигмоиднаяфункциядифференцируеманавсей оси абсцисс, что широко используется во многих алгоритмах обучения. Кроме того, она обладает свойством усиливать слабые сигналы лучше, чем сильные, и предотвращает насыщение от сильных сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон. Другойшироко используемой активационнойфункцией является гиперболический тангенс. В отличие от логистической функции гиперболический тангенс принимает значения различных знаков, чтодлярядасетей оказывается выгодным.

Для смещенной симметричной функции с насыщением выражение имеет вид

f (r) 1 e rr . 1 e

Упрощенные сигмоидные функции (гиперболический тангенс)

f (r) th(r) er e r ; f (r) (1 f (r))(1 f (r)). er e r

Линейная активационная функция y = k x.

Степенная функция с переменным показателем степени, равным текущему отклонению параметра

 

 

 

 

 

 

 

Uзад U

 

Kп

при Uзад U 0,

 

 

 

 

 

 

 

 

 

 

k k1

(1

 

Uзад U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при U

U

 

0,

k k

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

зад

 

 

где K – динамическая активационная функция; K1 – статическая активационная функция; Kn – коэффициент положительного модуля.

145

Вслучае когда функция активации одна и та же для всех нейронов сети, сеть называют однородной (гомогенной). Если же активационная функция зависит еще от одного или нескольких параметров, значения которых меняются от нейрона к нейрону, то сеть называютнеоднородной(гетерогенной).

Говоря о возможной классификации ИНС, важно отметить существование бинарных и аналоговых сетей. Первые из них оперируют с двоичными сигналами, и выход каждого нейрона может принимать только два значения: логический ноль («заторможенное» состояние) и логическаяединица(«возбужденное» состояние).

Ваналоговых сетях выходные значения нейронов способны принимать непрерывные значения. Еще одна классификация делит ИНС на синхронные и асинхронные ИНС. В первом случае в каждый момент временисвоесостояниеменяетлишьодиннейрон. Во втором – состояние меняется сразу у целой группы нейронов, как правило, у всего слоя. Для программных имитаторов нейронных сетей на цифровых ЭВМ вопросы, связанные с синхронизацией, решаются компьютером, на котором реализуются ИНС. Рассмотренная простая модель искусственного нейрона существенно упрощает ряд свойств биологического двойника. Например, она не принимает во внимание задержки во времени, которые воздействуют на динамикусистемы.

Входные сигналы сразу же порождают выходной сигнал и, что более важно, она не учитывает воздействие синхронизирующей функции биологического нейрона, которую ряд исследователей считают решающей.

Несмотря на эти ограничения, сети, построенные из этих нейронов, обнаруживают свойства, сильно напоминающие биологическую систему. Только время и дальнейшие исследования могут дать ответ на вопрос, являются ли подобные совпадения случайными или это следствие того, что в данной модели схвачены основные черты биологического нейрона.

Итак, дано описание основных элементов, из которых составляются нейронные сети. Перейдем теперь к вопросу, как составлять эти

146

сети, как их конструировать. Строгих ограничений здесь нет, как угодно, лишь бы входы получали какие-нибудь сигналы. Возможности безграничны, но обычно используют несколько стандартных архитектур, из которых при некоторыхнебольшихмодификацияхстроятбольшинствоиспользуемыхсетей.

2.3.Теоремы Колмогорова–Арнольда и Хехт–Нильсена

иих следствия

Построить многомерное отображение X Y – значит представить его с помощью математических операций над не более чем двумя переменными [6]. Ими доказано:

возможность представления непрерывных функций нескольких переменных суперпозициями непрерывных функций меньшего числа переменных (теорема 1);

любую непрерывную функцию трех переменных можно представить в виде суммы функций не более двух переменных (теорема 2);

любые непрерывные функции нескольких переменных можно представить в виде суперпозиций непрерывных функций одного переменного и сложения (теорема 3).

Данная теорема была переложена для нейронных сетей в работах Хехт–Нильсена. Теорема доказывает представимость функций многих переменных общего вида с помощью двухслойной нейронной сети с n нейронами входного слоя, (2n+1) нейронами скрытого слоя с заранее известными ограниченными функциями активации (например, сигмоидальными) и m нейронами выходного слоя с неизвестными функциями активации.

Основанием для построения нейронов и ИНС явилась теорема существования, предложенная У.С. Мак-Каллоком и У. Питтсом (1943) и две конструктивных теоремы.

Теорема существования утверждает, что любую функцию нервной системы можно описать с помощью конечного числа слоев из искусственных нейронов, то есть реализовать ИНС.

147

Первая конструктивная теорема говорит, что логические функции И, ИЛИ, НЕ можно вычислить с помощью двухслойной нейронной сети.

Вторая конструктивная теорема говорит, что любую логическую функцию относительно n бинарных элементов можно вычислить с помощью нейронной сети (которая использует в качестве компонентов элементы И, ИЛИ, НЕ).

2.4. Разновидности и классификация нейронных сетей

Нейрон есть элемент, выполняющий взвешенное суммирование значений координат входного вектора с последующим нелинейным / линейным преобразованием суммы. Входные сигналы x1… xn через блоки весовых коэффициентов wn (синапсы) подаются на сумматор вместе со смещающим сигналом x0. Результирующий сигнал r подается на вход активационной функции F, единственный выход которого в нейрофизиологии называют аксоном. Степень «интеллекта» одиночного нейрона очень незначительна. Ощутимый эффект в обработке данных может быть достигнут только использованием множества взаимодействующих между собой адаптивных нейронов. Нейроны группируются в нейронные слои и образуют искусственные нейронные сети (ИНС). ИНС индуцированы биологией, так как в некоторой степени соответствуют анатомии мозга, которому присущи [9, 52]:

массовый параллелизм, т.е. параллельная обработка информации одновременно всеми нейронами, что допускает обработку сигналов в реальном времени;

способность к обучению и обобщению;

адаптивность;

толерантность (нечувствительность) к ошибкам;

низкое энергопотребление.

На рис. 2.8 приведена классификация нейронных сетей.

148

Рис. 2.8. Классификация искусственных нейронных сетей

Многослойные ИНС делятся: на сети без обратной связи (ОС), ИНС с ОС и гибридные.

По типам структур нейронов ИНС делятся: на однородные (гомогенные) и гетерогенные (неоднородные) структуры.

По выходному сигналу ИНС делятся: на системы с бинарным и аналоговым выходами.

По времени срабатывания ИНС делятся: на синхронные и асинхронные системы.

В общем случае ИНС рассматривается как направленные графы сигналов, у которых узлами являются искусственные нейроны, а ветви – коэффициенты между узлами. По архитектуре связей ИНС разделяются на два класса:

сети прямого действия, или статические сети;

сети с обратными связями, или динамические сети. Комплекты нейронов, разделенные на слои, образуют много-

слойную ИНС.

Многослойная ИНС состоит:

из входного слоя (входные сигналы) с весовыми коэффициентами, устанавливаемыми с целью масштабирования входных величин;

скрытых (промежуточных) слоев, определяемых эвристическим путем исходя их объема области знаний и сложности задачи регулирования;

149

– выходного слоя.

Рассмотрим построение стандартных нейронных сетей на базе искусственных нейронов Мак-Каллока и Питтса, каждый из которых выполняет арифметические операции умножения и сложения.

2.4.1. Нейронные сети без обратных связей

Сети прямого распространения (Feedfoeward)

Сети прямого распространения применяются для распознавания образов, решения задачи предсказания временных рядов, финансовых рисков, адаптивного управления, цифровой обработки и сжатия сигналов и т.д. Многослойные нейронные сети способны с различной точностью аппроксимировать любую из существующих логических функций [9].

От архитектуры межнейронных связей зависит интеллект, класс решаемых задач, сложность технической реализации, принципы построения алгоритмов обучения и т.д. Одной из первых предложенных моделей структурной организации нейронной сети был персептрон Розенблатта, который представлял собой однослойную сеть, построенную из формальных нейронов. Все связи направлены строго от входных нейронов к выходным нейронам.

Сети встречного распространения

Данные сети строятся также на базе искусственных нейронов. По своим возможностям данные сети превосходят возможности однослойных сетей. Время их обучения в 100 раз меньше, чем сети с обратным распространением. Применяются тогда, когда время на обучение ограничено. В сетях встречного распространения (рис. 2.9) объединены два алгоритма: самоорганизующаяся карта Кохонена и звезда Гроссберга [9].

Самоорганизующаяся карта Кохонена. Примером сети, ис-

пользующей алгоритм обучения без учителя, является введенная Т. Кохоненом (1982) «саморганизующаяся карта признаков». Идея сети Кохонена возникла при изучении некоторых свойств головного

150