Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекц_нейр_ сети.(2008-09-10).doc
Скачиваний:
119
Добавлен:
23.09.2019
Размер:
2.22 Mб
Скачать

3.1.2. Нейросетевое прямое и косвенное адаптивное управление на основе желаемой (эталонной) модели

Важным приложением нейронных сетей является создание системы управления с обратной связью. Структура этой системы усложняется наряду с нелинейностью объекта другими факторами, как, например, наличие неизмеряемых и случайных возмущений, его структурных и параметрических неопределенностей, ненаблюдаемостью состояний. Удобной для применения стратегией управления таким объектом является адаптивное управление на основе эталонной модели (модели желаемой системы). На рис. 12 показана структура такой системы. Для учета того, что динамика объекта неизвестна, в ней (системе) используется механизм адаптации. Управляющее устройство (нейронная сеть) и объект формируют систему с собственной обратной связью. Объект получает от управляющего устройства входной сигнал u[i]. Также на него влияет возмущающее воздействие f[i]. Выход объекта, который обозначается как y[i+1], зависит также от собственного состояния x[i] объекта. Управляющее воздействие

u[i]=g1(v[i], y[i], xu [i], W)

зависит от собственного состояния управляющего устройства xu[i] и от матрицы весовых коэффициентов и смещений нейронной сети W, доступных для коррекции. Вектор–функция g1(.) определяет динамику управляющего устройства.

Рис. 12

Желаемая реакция d[i+1] формируется на выходе устойчивой эталонной модели (желаемой системы), которая образуется в ответ на желаемое задающее воздействие (эталонный сигнал). Желаемая реакция d[i+1] таким образом, является функцией эталонного сигнала v[i] и собственного состояния xd [i] эталонной модели:

d[i+1]=g2(v[i], xd [i]).

Вектор-функция g2(.) определяет динамику эталонной модели. Пусть ошибка на выходе, т.е. разность между выходами эталонной модели и объекта, обозначается как

e[i+1]=d[i+1]-y[i+1].

Наша цель состоит в том, чтобы так корректировать параметры W, чтобы норма ошибки выхода e[i] была бы минимизируема для момента времени i.

Метод управления, используемой в MRAC-системе (рис. 11), назван адаптивным прямым управлением в том смысле, что для идентификации объекта не предпринимается никаких действий, но при этом напрямую корректируются параметры управляющего устройства для повышения качества системы. К сожалению, пока не существует точных методов настройки параметров управляющего устройства, основанных на ошибке выхода, поскольку между управляющим устройством и ошибкой на выходе находится неизвестный объект. Чтобы обойти эту сложность, можно прибегнуть к адаптивному непрямому (косвенному) управлению (рис. 13). В этом последнем методе для обучения управляющего устройства используется двухшаговая процедура:

  1. Для оценки выхода объекта путем идентификации определяется модель объекта. Для обучения нейронной сети используется ранее описанная технология.

  2. Для получения градиента выхода объекта по настраиваемым параметрам управляющего устройства вместо самого объекта используется полученная на предыдущем шаге модель объекта.

Рис. 13

Нейросетевые модели применяются также в других структурах, основанных на использовании моделей объекта, например, в системах управления с внутренней моделью и в системах с управлением с предсказанием, где в качестве моделей объекта используются нейросетевые модели.