Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление

.pdf
Скачиваний:
88
Добавлен:
25.10.2023
Размер:
13.81 Mб
Скачать

Г л а в а п е р в а я ОБЩИЕ ОПРЕДЕЛЕНИЯ

Изложение начинается с качественного описания в § 1-1 понятий оценки и управления и обсуждения свя­ занного с ними класса задач.

В§ 1-2 обсуждаются некоторые технические задачи, для которых вопросы оценки и управления имеют прин­ ципиальное значение. Изложение также носит качествен­ ный характер.

В§ 1-3 приводится краткое содержание книги с тем, чтобы обозначить конкретное направление дальнейшей работы.

Многие термины, качественно введенные в этой гла­ ве, будут уточнены в последующих главах. Цель первой главы заключается в том, чтобы обеспечить общее ин­ туитивное представление о классе рассматриваемых за­ дач.

1-1. ОЦЕНКА И УПРАВЛЕНИЕ

В книге рассматривается класс задач, входящих в общую задачу оценки и управления в динамических

системах.

Общая

задача иллюстрируется структурной

схемой

на

рис.

1-1.

Динамическая

система

показана

с двумя

множествами

входных

переменных і :

множество

сигналов управления,

которые

обычно

можно

изменять,

и множество возмущающих сигналов, отражающих на-< личие внутренних и (или) внешних (заданных) явлений, т. е. явлений, присущих самой системе и окружающей среде. К подобным явлениям можно отнести шум в элек­ тронных цепях, наложение сигналов из-за паразитных связей, неравномерность полета самолета, вызванную случайными порывами ветра, и пр.

1 Двойные линии на рисунке означают, что в потоке сигналов, вообще говоря, может быть более одной переменной.

10

Поведение или отклик1 системы наблюдается с по­ мощью соответствующего набора датчиков, называемого измерительной системой. Датчики подвержены случай­ ным и систематическим инструментальным и методиче­ ским ошибкам. Например, на некоторых ИСЗ исполь­ зуется датчик горизонта для определения местной вер­ тикали как биссектрисы угла, образованного визирными линиями от датчика к горизонту. Этот прибор дает оши-

г7

3

 

8

f

s

S

 

Рис. 1-1. Структурная схема общей задачи оценки и управ­ ления.

/ — входные

сигналы

управления;

Рис.

1-2.

Измерение

2 — в о з м у щ а ю щ и й

процесс; 3 — пе­

местной

вертикали

дат­

ременные

возмущения;

4 — дина­

чиком

горизонта.

 

мическая

система,

объект;

5 — пе­

/ — датчик

 

горизонта;

2 —

ременные

состояния

системы;

6 —

 

измерительная

система;

7 — ф а к ­

линии

визирования;

3—из­

торы, вызывающие ошибки изме ­

меренное

направление

мест­

рения; 3 — ошибки

измерения;

9 —

ной вертикали: 4— темный

измерения .

 

 

 

 

 

 

участок

область нечетко­

 

 

 

 

 

 

 

го горизонта.

 

бочные показания не только

из-за внутренних шумов,

но

и из-за

того, что нерегулярности в атмосфере Земли

не

позволяют точно определить положение горизонта.

Ситуация

иллюстрируется

двумерной

моделью на

рис.

1-2.

 

 

 

Вообще говоря, измерения дают только грубую ин­ формацию о поведении системы и их может быть недо­ статочно для изучения характеристик системы.

Задача оценки состоит в аппроксимации, процесса из­ менения переменных, характеризующих отклик системы на внешние воздействия, на основе измерений, содержа­ щих ошибки. Если вводится критерий качества для оп­ ределения качества аппроксимации или оценки и оценкя должна выбираться так, чтобы этот критерий качества

1 Точнее, речь идет о состоянии системы. Это понятие рассмат­ ривается в гл. 2. Пока достаточно использовать термины «поведе­ ние-» или «отклик» системы.

11

был максимальным или минимальным, то задача фор­ мулируется как задача оптимальной оценки. Таким об­ разом, задача состоит в построении алгоритма для об­ работки данных измерения.

Задача управления представляет собой задачу опре­ деления метода, с помощью которого следует формиро­ вать входные сигналы управления, чтобы заставить уп­ равляемую систему действовать определенным желае­ мым образом. Если, так же как в задаче оценки, для оценки качества поведения системы вводится критерий качества и сигналы управления используются для того, чтобы минимизировать или максимизировать этот крите­ рий качества, задача называется задачей оптимального управления. Так же как и в задаче оценки, здесь подра­ зумевается разработка алгоритма (управления).

При решении последней задачи удобно разделить ее на две: задачу оценки отклика системы и задачу по­ строения алгоритма управления с использованием полу­ ченных оценок. Такое разделение качественно понятно, так как ясно, что следует определить поведение системы, прежде чем можно будет рассчитать управляющее воз­ действие, которое должно изменить это поведение. Од­ нако до сих пор не доказано, что подобное разделение во всех случаях математически обосновано.

Если в задачах оценки и управления

возмущающий

процесс и процесс, вызывающий

ошибки измерения, рас­

сматриваются как

случайные

явления,

то можно

ис­

пользовать

термин

задача

статистически

оптимального

управления

или стохастическая

задача оптимального

уп­

равления.

 

Далее,

если

модели

динамической системы и

связанной

с ней

измерительной

системы

линейные,

то

можно

использовать

понятие

линейная

стохастическая

задача

оптимальной

оценки

и управления,

соответствую­

щее классу задач, рассматриваемых в настоящей книге. В заключение параграфа опишем общую методику, принимаемую в дальнейшем за основу при исследовании

указанного класса задач:

1. Построение моделей. Здесь имеются в виду раз­ личные модели для динамической и измерительной си­

стем, возмущающего

процесса, ошибок измерения. Как

и при формулировке

любой

математической модели фи­

зического процесса, задача

состоит в получении моделей,

дающих

достаточно полное описание явлений, представ­

ляющих

интерес, но

не настолько сложных, чтобы их

12

нельзя было использовать для аналитических и вычисли­ тельных целей.

2. Выбор критериев качества. Этот этап относится к определению целей работы. Как и на предыдущем эта­ пе, выбранные критерии качества должны иметь физи­ ческий смысл для изучаемого явления, а также легко описываться математически.

3.Формулировка задачи. Здесь информация, полу­ ченная на первых дзух этапах, объединяется с наложе­ нием всех ограничений, необходимых для постановки задачи.

4.Разработка алгоритмов оценки и управления. За­ дача этого этапа ясна. Однако не следует ограничивать­ ся просто синтезом алгоритмов. Действительно, получен­ ные результаты важно проверить на практике. Перво­ очередным вопросом является оценка вычислительной сложности алгоритмов.

1-2. ОБЛАСТИ ПРИМЕНЕНИЯ

Системы связи

Важной задачей теории связи является задача об­ работки принятого сигнала для выделения «сообщения». Общая схема системы связи показана на рис. 1-3.

Рис. 1-3. Схема системы связи.

/ — передатчик;

2 передаваемый

сигнал;

3 канал

связи;

4 — возмущения;

5 — п р и ­

нимаемый

сигнал; 6 — приемник — систе­

ма оценки.

Передаваемый сигнал состоит не только из сообще­ ний, но также из ошибок, возникающих при кодирова­ нии и передаче. Кроме того, сигнал подвергается воз­ действию возмущений в канале связи, таких как атмо­ сферный шум. На приемном конце линии связи задача заключается в оценке того, какое сообщение было пе­ редано.

13

Навигация

Задача навигации заключается в определении поло­ жения и скорости корабля или снаряда в некоторой си­ стеме координат с использованием данных навигацион­ ных измерений, таких как дальность, радиальная ско­ рость и угловые координаты. Важность задачи навигации для полета самолетов и космических кораблей, а также для вождения надводных судов и подводных лодок оче­ видна.

Так как навигационные измерения подвержены воз­ действию инструментальных и методических ошибок, обычно необходимо иметь в распоряжении алгоритм оценки для обработки этих измерений с целью получе­ ния полезной информации.

На следующем этапе оценки координат и скорости могут использоваться при изменениях курса для дости­ жения поставленной цели, например орбитального пере­ хода для обеспечения встречи в космосе.

Анализ результатов эксперимента

Обычно после окончания эксперимента для опреде­ ления его результатов желательно сократить число по­ лученных измерительных данных. Эта задача представ­ ляет собой задачу оценки, так как измерения подверже­ ны воздействию ошибок.

Например, пусть данные телеметрии и траекторных измерений во время запуска космического аппарата, вы­ вода на орбиту и последующего орбитального полета обрабатываются для получения оценок истинной траек­ тории полета, ошибок в значениях параметров системы управления (дрейф гироскопов, ошибки смещения и масштабных " коэффициентов акселерометров, ошибки бортовой управляющей ЭВМ и т. д.) и точности выведе­ ния на орбиту. Такая информация полезна для опреде­ ления того, насколько эффективно выполнены задачи запуска, для определения слабых мест системы, оценки параметров различных подсистем и определения основ­ ных направлений работы по дальнейшим запускам.

Измерения, проделанные за время протекания хими­ ческого процесса, также можно обрабатывать после его окончания для определения таких параметров, как ско­ рость реакций и начальные «концентрации веществ, уча­ ствующих в реакции.

14

Управление технологическим процессом

Успешное функционирование больших производст­ венных систем или протекание сложных технологических процессов обычно подразумевает регулирование или уп­ равление для повышения их эффективности, качества продукции и (или) для достижения других конкретных целей. Обычно задача усложняется необходимостью об­ работки полученных данных во время работы для оцен­ ки текущего состояния процесса и введения этой инфор­ мации в алгоритм управления, который затем формирует стратегию управления с целью компенсации внутренних и внешних возмущений и достижения расчетных условий протекания процесса. Эту задачу можно классифициро­ вать как задачу оценки и управления в реальном масш­

табе времени.

В качестве частных примеров можно привести управ­ ление станками с помощью ЭВМ, управление космиче-

Р

Рис.

1-4.

Схема

радиоуправления.

/ — команды управления;

2 — п е р е д а ч а

команд управления на борт космического

аппарата;

3 — обработка данных

(оценка);

4 — Р Л С

траекторных

измерений;

5 — д а н ­

ные

телеметрии

с

борта

космического

аппарата;

Р — точка

вывода

на

орбиту .

ским полетом и

полетом

самолета

или многоступенча­

тым химическим процессом, например процессом ката­ литического крекинга.

На рис. 1-4 показана схема радиоуправления при пу­ ске ракеты для вывода спутника на орбиту в заданной" точке Р. Как данные телеметрии с борта запускаемого аппарата, так и данные наземной радиолокационной

15

станции (РЛС) траекторных измерений (значения даль­ ности, радиальной скорости, азимута и угла места) об­ рабатываются для оценки состояния аппарата. Эта оцен­ ка поступает на вход ЭВМ, вырабатывающей команды

управления

(сигналы

для изменения направления

поле­

та и выключения двигателей), которые в свою очередь

передаются

на борт

космического аппарата, где

они и

исполняются. Из схемы понятны как характер обратной связи, так и необходимость проведения довольно слож­ ных расчетов.

Основными задачами здесь являются:

1) оценка «состояния» аппарата таким образом, что­ бы минимизировать воздействие ошибок, присутствую­ щих в данных телеметрии и траекторных измерений;

2) настройка алгоритма управления на минимизацию

некоторой функции

от ошибок по положению и скорости

в точке вывода на

орбиту.

1-3. КРАТКОЕ С О Д Е Р Ж А Н И Е КНИГИ

В гл. 2—4 приведены основные результаты теории линейных систем, теория вероятностей и теории случай­ ных процессов. Основным итогом этих глав является по­ строение двух типов моделей систем (см. § 4-2 и 4-3), для которых в остальной части книги формулируются и решаются задачи оценки и управления. Как отмечалось

впредисловии, читатель, знакомый с теорией, описанной

вэтих трех главах, может сразу начать с последних двух параграфов после того, как бегло просмотрит материал первых глав для ознакомления с терминологией и обо­ значениями.

В начале гл. 5 формулируется задача

оптимальной

оценки систем с дискретным временем и для

этой зада­

чи доказываются три основные теоремы

и

следствие.

В предлагаемой формулировке задачи оценки разделя­ ются на три категории в зависимости от момента вре­ мени оценки относительно моментов времени известных измерений (табл. 1-1).

В остальной части гл. 5 внимание сосредоточено на получении алгоритмов оптимального предсказания и фильтрации (фильтр Калмана) для первой из двух рас­ сматриваемых моделей систем, так называемой гауссовской марковской последовательности (с дискретным вре­ менем) .

16

Т а б л и ц а 1-1

Классификация оценок

Класс задач оценки

Интервал измерений

Время

оценки

Предсказание

 

 

 

 

Любое t >

tx

Фильтрация

 

 

 

 

 

t =

tx

Сглаживание (интерполя­

 

 

 

Любое или все t, для

ция)

 

 

 

 

которых t„ <

t ^ ti

П р и м е ч а н и е .

t0— фиксированный момент

времени; t,

_ і переменное время;

t, может быть как фиксированным, так и переменным.

,

, .-, .

Вопрос об оптимальном сглаживании

для того же

класса моделей систем

исследуется в гл. 6. Оказывается,

что удобно разделить

задачу

сглаживания на три за­

дачи и разрабатывать

алгоритмы

оптимального сглажи­

вания для каждой задачи в отдельности.

 

 

В гл. 7 исследуется

задача

оценки для второй из рас­

сматриваемых

моделей

систем, для гауссовского марков­

ского процесса

(с непрерывным

временем). Алгоритмы

оптимального предсказания, фильтрации и сглаживания

получаются с помощью формальной процедуры

предель­

ного перехода из алгоритмов гл. 5 и 6.

 

 

 

Другой метод

решения задачи оценки для гауссов­

ского марковского

процесса приведен

в гл. 8.

Этот ме­

тод дополняет

подход, приведенный

в гл. 7,

так

как

в гл. 8 задача

полностью решается в непрерывном

вре­

мени. Центральным результатом главы является интег­

ральное уравнение

Винера—Хопфа,

которое

выводится

с использованием

методов классического

вариационного

исчисления.

Поскольку

алгоритмы

оптимального

пред­

сказания,

фильтрации

и сглаживания

уже

получены

в гл. 7, интегральное

уравнение Винера—Хопфа

решает­

ся только для задачи

оптимальной

фильтрации

(фильтр

Калмана—Бьюси)

и для одного из случаев оптимально­

го сглаживания с целью иллюстрации процедуры

реше­

ния уравнения.

 

 

 

 

 

 

 

В гл. 9 и 10 представлены формулировка

и решение

так называемых задач

дискретного

и непрерывного ли­

нейного стохастического регулятора. С использованием

динамического программирования

доказывается принцип

2—85

17

 

^ Г О С . П У Б Л И Ч Н А Я

 

Н Л У Ч ! : 0 - Т Е Х г - і И Ч Е С К А Я

разделений, утверждающий, что систему управлений в целом можно рассматривать как последовательно сое­ диненные оптимальный фильтр и нестационарную цепь обратной связи, причем оба устройства можно оптими­ зировать независимо друг от друга.

Литература к гл. 1 представляет некоторые основные работы в области оценок и управления в стохастических системах.

Г л а в а в т о р а я ЭЛЕМЕНТЫ ТЕОРИИ ЛИНЕЙНЫХ СИСТЕМ

Настоящая глава преследует две цели: во-первых, в ней дается общее введение в теорию двух моделей си­ стем, используемых в дальнейшем, и, во-вторых, иссле­ дуются и иллюстрируются некоторые фундаментальные свойства этих моделей 1 .

Для достижен-ия первой цели в § 2-1 рассмотрены не­ которые результаты матричного анализа. В этом пара­ графе также вводятся многие обозначения, используе­ мые во всей книге. В § 2-2 представлена первая из двух моделей систем и с помощью нескольких примеров ил­ люстрируется ее важность. В этом параграфе также ис­ следуются некоторые свойства модели с использованием ряда понятий из теории обыкновенных линейных диффе­ ренциальных уравнений.

Вторая

модель вводится и исследуется в § 2-3.

В § 2-4

приводится качественное обсуждение поня­

тий наблюдаемости и управляемости, возникающих со­ ответственно в задачах оценки и управления.

Эти два понятия более подробно исследуются в § 2-5 и 2-6 для двух частных моделей систем. Выводятся не­ обходимые и достаточные условия наблюдаемости и уп­ равляемости, чтобы дать читателю некоторое представ­ ление о характере задач оценки и управления, а также об условиях, при которых рассматриваемые здесь алго­ ритмы оценки и управления имеет смысл применять.

В заключение главы в § 2-7 исследуются возможно­ сти использования линейных моделей § 2-2 и 2-3 для

1 Более подробное описание моделей отложено до гл. 4, по­ скольку оно требует ряда сведений из теории вероятностей и случай­ ных процессов, приведенных в гл. 3 и в первой части гл. 4.

18

моделирования поведения нелинейных систем, линеари­ зованных относительно заданных номинальных условий.

Материал настоящей главы представляет собой часть теории линейных систем. Более подробное исследование этого предмета имеется, например, в книге Деруссо и др. ІЛ. 2-1]. В книге Заде и Дезоера [Л. 2-2] представлено математически более строгое изложение материала.

Читателю, нуждающемуся в дополнительном мате­ риале по матричному анализу и теории обыкновенных линейных дифференциальных уравнений, могут оказать­ ся полезными приложение к гл. 6 книги Каплана [Л. 2-3], гл. 2, 3, 4, 6 и 10 книги Беллмана [Л. 2-4] и гл. 1 книги Хильдебранда [Л. 2-5]. Строгое изложение теории обык­

новенных

дифференциальных

уравнений

приводится

в гл. 1—3

книги Коддингтона

и Левинсона

[Л. 2-6].

2-1. ОБОЗНАЧЕНИЯ И ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

Все переменные, рассматриваемые в дальнейшем, являются действительными, если это специально не ого­ варивается. Соответственно все функции являются функ­ циями действительного переменного, кроме специально оговоренных случаев.

Матрицы

и

векторы

В общем случае прописные латинские и греческие

буквы, такие

как

Л, В, Г, Ѳ и т. д., будут использовать­

ся для обозначения матриц, а соответствующие им строчные буквы с индексами — для обозначения элемен­ тов матриц. При индексации элементов матриц обычно

первым индексом является номер строки,

а

вторым —-

номер

столбца.

Например,

под

матрицей

А

размера

пгХп

подразумевается

 

 

 

 

 

 

 

 

 

# 2 l a 2 2 • • • a 2 n

 

 

 

 

 

 

 

"ml"»iS •

• Я»,-

 

 

 

 

Это обозначение иногда записывают в виде

А — ||а,-3-||.

Индексы і

и /

относятся

соответственно

 

к

строке

и

столбцу, в которых расположен элемент.

 

 

 

 

Матрица

называется прямоугольной,

если

тфп,

и

квадратной,

если пг = п.

 

 

 

 

 

 

2*

19

Соседние файлы в папке книги из ГПНТБ