Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Системы экстремального управления

..pdf

Скачиваний:

Добавлен:

19.11.2023

Размер:

33.28 Mб

Скачать

☆

<<< < Предыдущая 29 30 31 32 33 34 35 36 37 38 39 4041 / 6241 42 43 44 45 46 47 48 49 50 51 52 53 > Следующая >>>

Дворецкого. Однако при определенных видах показателя качества некоторые из требований (16.4.4) можно снять. Так, для объектов типа квадратичной формы процесс поиска будет сходиться быстрее, если g = const и а — = const, т. е. величины пробных и рабочих шагов не уменьшаются. Это связано с тем, что квадратичная форма гарантирует несмещенность оценки (16.5.2), о чем говори лось в § 15.1. С другой стороны, градиент квадратичной формы уменьшается по мере приближения к цели, что и обеспечивает сходимость поиска.

Как видно, априорные сведения об объекте могут зна чительно убыстрить сходимость процедуры стохастической аппроксимации.

Метод стохастической аппроксимации гарантирует отыскание точного положения экстремума функции ка чества в обстановке помех при N оо. Однако при реше нии практических задач такой необходимости пет. Реаль ные задачи всегда решаются с конечной точностью — нужно попасть в заданный район цели. Это заставляет модифицировать метод, изменяя характер зависимостей

O .N = f (N) и gN = ф (N).

Методы случайного поиска отличаются от регулярных (детерминированных) методов оптимизации намеренпым введением элемента случайности. Это означает, что в од ной и той же обстановке решение о направлении рабочего шага, принятое по методу случайного поиска, будет раз ным. Однако подобное «случайное» поведение является не только целесообразным, но в большом числе случаев и более эффективным, чем регулярное поведение.

Метод случайного поиска является прямым развитием известного метода проб и ошибок, когда решение ищется случайно, и при удаче принимается, а при неудаче отвер гается с тем, чтобы немедленно снова обратиться к слу чайности как к источнику возможностей. Такое «случай ное» поведение разумно опирается на уверенность, что случайность содержит в себе все возможности, в том числе и искомое решение во всех его вариантах.

Метод проб и ошибок является универсальным методом решения задач при недостаточной априорной информации об объекте. Он моделирует случайный поиск, имеющий место в природе, которую по праву можно считать изобре тателем случайного поиска.

Одним из проявлений эффективного случайного поиска в природе являются законы эволюции, открытые Ч. Дарвиным,— естественный и искусственный отбор. Здесь элемент случайности проявляется в виде мутаций, которые имеют случайный характер. Эти мутации могут либо улуч шить, либо ухудшить приспособительные свойства особи. В первом случае эта особь имеет больше шансов на выжи вание и, следовательно, на закрепление полученной мута ции в потомстве, чем во втором. Так, случайные мутации с последующим отбором (искусственным или естественным) являются могучим фактором прогресса в живой природе. А это не что иное, как случайный поиск.

§ 17.1. Гомеостат Эшби

Первым прибором, работающим по методу случайного поиска, был гомеостат Эшби, предложенный и построен ный им в 1948 г. [17.1, 17.2]. Гомеостат состоял из четырех

блоков, каждый из которых (рис.			17.1.1)		представлял
собой динамическую	систему вида
cLx»	... +	ai4x4 (i =		1,..., 4),		(17.1.1)
-gp = <*11. +
где Xi — выход i-го блока, а а.ц (/ =			1 ,	., 4)		его па-
раметры. Все переменные		гомеостата		ограничены:			а ^
		< a = i < 6	(i = 1		,	., 4),	т. е.
		в процессе его функциониро
		вания переменные				не могут
		выходить		за	определенные
		пределы.
		Таким образом, поведение
		гомеостата		описывалось			си
		стемой	дифференциальных
		уравнений:

Рис. 17.1.1. Схема первого блока гомеостата.

= АХ, (17.1.2)

где	X —	(xlt х2, х3, х4) — вектор	состояния гомеостата,
А =	I ау	I — квадратная матрица	его параметров, ко

торая в значительной степени определяет характер пове дения гомеостата. Все множество возможных матриц {А} можно подразделить на два класса: класс устойчивых матриц, которые делают гомеостат устойчивой системой,

икласс неустойчивых матриц (в противном случае). Задача заключалась в том, чтобы подобрать такие зна

чения параметров гомеостата (ап , а12, . ., а44), т. е. найти такую матрицу А, при которой он был бы устойчив. Из теории обыкновенных линейных дифференциальных урав нений известно, что для этого достаточно, чтобы все корни уравнения

бц —	Я»	6jj	6j3	бц
й21	й22 — Я<		Û23
0>ZX		®32	®33 — Я»	®34

Д41

Д42

Д43

Д44 — Я.

параметров. Положительная реакция R+ следует за вы полнением в объекте цели управления, т. е. при устойчи вой реакции гомеостата. Она сохраняет в объекте те па раметры, которые привели к достижению цели. Алгоритм такого поведения удобно записать так:

при R ,

(17.1.7)

при R

Как легко заметить, такой алгоритм работы системы во обще и гомеостата в частности имеет целесообразное пове дение, направленное на поиск и сохранение в системе стабильного состояния, которое обеспечивает положи тельная реакция 7?+. Этот алгоритм естественно назвать алгоритмом с «наказанием» случайностью, так как слу чайное воздействие S вводится как реакция на неудачу в процессе управления.

Таким образом, смысл и содержание рассмотренного алгоритма случайного поиска заключается в том, чтобы случайно перебирать параметры системы до тех пор, пока не будут найдены такие, которые обеспечивают выполнение заранее сформулированных условий. В случае гомеостата таким условием является отыскание устойчивого состояния системы. Очевидно, что такой способ поведения представ ляется наиболее целесообразным в том случае, когда у управляющего устройства нет никаких сведений о струк туре объекта, т. е. он представляет собой «черный ящик».

Однако для работы этого алгоритма необходимо фор мально определить, что считать устойчивой и неустойчи вой работой гомеостата. Известно, что система однородных дифференциальных уравнений вида (17.1.1) имеет един ственное устойчивое решение хг — хг = х3 = ж4 = 0. Поэтому в основу критерия устойчивости можно положить

величину отклонения		от	устойчивого состояния
				4		(17.1.8)
						(17.1.8)
Теперь, задав	порог	Ô	0,	можно	при Q < ô	систе
му считать	устойчивой,		а	при Q^>b — неустойчивой
(см. рис. 17.1.2, где заштрихована					устойчивая	в этом
смысле зона).
Заметим, что такое определение устойчивости условно,
так как при Q	Ôсистема может быть уже неустойчивой,

а при Q	Ô может быть устойчивой (см. рис. 17.1.2).
Однако эти	случаи можно исключить, если управле

ние сделать не мгновенным, а инерционным, т. е. реагиро вать на состояние системы не мгновенно, а через некоторое время наблюдения. За это время переходные процессы в системе затухнут и указанный критерий будет объек

тивно отражать состояние	системы.
Сформулированный алгоритм работы гомеостата можно
записать в виде	при <)(X )>ô,
[ S
"+1" 1 4	(17.1.9)
	при Q (X) < Ô.

Естественно теперь задать вопрос: всегда ли можно найти параметры, при которых гомеостат окажется устой

чивым, т. е. возможно ли			х2
случайным перебором пара			//////у 7 ,
метров достигнуть	устойчи	'/////>
вости всегда и наверняка?		1	6 9
Для ответа на этот вопрос
разобьем множество всех воз			.
можных реализаций парамет
ров гомеостата на	два под		%
множества {4°} и {Л*}, в		//717 7 7 7 // 7 7 7 7 7 7 //
первое из которых объедине
нызначения параметров, при
водящие к неустойчивости, а		Рис. 17.1.2. Пространство пе
во второе — вызывающие по
		ременных гомеостата.

ложительную реакцию, т. е.

обеспечивающие устойчивость гомеостата. Решение за дачи заключается, таким образом, в случайном отыскании хотя бы одного элемента второго множества за конечное число шагов поиска (под шагом поиска здесь подразуме ваются однократный случайный выбор параметров гомео стата и определение, к какому классу они относятся, т. е. проверка устойчивости). Ясно, что для этого необходимо, чтобы оба подмножества были примерно одинаковы. Это означает, что при случайном переборе всех возможных параметров «представители» подмножества {Л*} должны встречаться не слишком редко. Тогда при случайном пе реборе элементов множества всех возможных параметров

вероятность выбора хотя бы одного	из элементов	это
го подмножества будет конечна.	Следовательно,	по

вероятности процесс поиска закончится в конечное время и гомеостат обязательно придет в устойчивое состояние.

Представим работу гомеостата как функционирование некоторого стохастического автомата, действующего в слу чайной среде. С точки зрения управления гомеостат следует «расслоить» на среду и управляющее устройство УУ (рис. 17.1.3). Под средой здесь подразумевается динами ческая система (17.1.2), а управляющее устройство рабо тает в соответствии с алгоритмом случайного поиска (17.1.8). Динамическую систему следует привести в устой

	чивое состояние X*, незави-
	X* симо от действия случайного
С р е д а	фактора Е.
А	Алгоритм случайного по-
А	иска (17.1.9),	реализуемый
Q	иска (17.1.9),	реализуемый
УУ	управляющим	устройством
	гомеостата, является стохас
Рис. 17.1.3. Представление го	тическим автоматом, выход
меостата в виде автомата, дей	которого А изменяется в за
ствующего в случайной среде.	висимости от состояния вхо-

да Q. Стохастическая матрица, характеризующая функцио

нирование этого автомата в случайной среде,				имеет вид
	R-	1 - P	Р	(17.1.10)
	R+	О	1

где	Р — вероятность отыскания		устойчивого решения,
удовлетворяющего поставленным целям				управления
(Q ^	Ô). Эффективность	функционирования		гомеостата,

очевидно, существенно зависит от величины Р. Чем боль ше Р, тем быстрее находится решение и тем эффективнее работает гомеостат.

Стохастический характер поведения гомеостата, как видно, определяется двумя факторами: оператором слу чайного шага S и неопределенностью среды, которая зависит от неизвестного случайного фактора ситуации Е.

Граф алгоритма работы гомеостата показан на рис. 17.1.4. Здесь кружками обозначены события — поло жительная и отрицательная реакции, а стрелками — условные переходы между ними. В скобках записаны усло вия этих переходов. Пунктирная стрелка показывает пере ход, не предусмотренный алгоритмом и соответствующий

потере устойчивости гомеостата за счет случайного воз действия Е.

Отметим, в заключение, некоторые характерные осо бенности алгоритма управления гомеостатом/: В этом управлении имеются два резко противоположных режима работы поиска. В первом, «наказуемом», системе предла гаются различные случайные варианты управления. Этот процесс продолжается до тех пор, пока не будет найдено удовлетворительное решение ((? ^ Ô), после чего включа ется второй режим, когда в виде «поощрения» система сохраняет найденные в первом режиме параметры.

Щ > 9 )

Рис. 17.1.4. Граф алгоритма гомеостата (линейная тактика).

Будем такой способ поведения называть линейным, а тактику такого поиска — линейной тактикой.

Как видно, линейная тактика отличается сохранением того управления, которое привело к успеху. Эта тактика имеет несколько «педантичный» характер, но вполне ра зумна и обоснованна при управлении не слишком слож ными системами (под сложностью в данном случае подра зумевается не число параметров, а структура задачи). В большинстве случаев линейная тактика управления приводит к эффективным результатам.

§ 17.2. Случайный поиск с линейной тактикой

Линейная тактика, как сказано выше, отличается тем, что действие, которое привело к удаче, сохраняется и далее. Применим эту тактику для оптимизации объекта.

Одним из алгоритмов случайного поиска, использую щего линейную тактику, является гомеостатический поиск построенный по алгоритму гомеостата (17.1.9)

Здесь определяется такой вектор оптимизируемых пара метров X*, который обеспечивает выполнение неравенства

Q (X *) < Ô,		(17.2.2)
где Ô — заданное число,	S — случайный	вектор,
S = (?„	Ы ,	(17-2.3)

распределенный равномерно в зоне допустимых парамет ров, т. е. S G S.

Гомеостатический поиск представляет собой случайное сканирование и его целесообразно применять только тогда, когда вероятность Р отыскания решения, удовлет воряющего неравенству (17.2.2), достаточно велика. Эта вероятность определяет среднее число шагов случайного поиска, необходимых для решения задачи:

ЛГср=-р--

(17.2.4)

Как видно, при малых значениях вероятности Р среднее число шагов поиска велико.

Рассмотрим пример применения этого алгоритма — один из способов решения системы линейных алгебраиче ских уравнений:

/^1

===Cj

(/ ==

•••» Гг),

(17.2.5)

i= l

где ац и cj (i, / = 1, . ., гг) — заданные величины, — неизвестные. Образуем функцию невязки

п	п
Q(X)= 2	( 2 а д - ^ ) -	(17.2:6)

3=1 i= 1

минимум которой равен нулю и, следовательно, соответствует решению задачи X*. Уравнение

Q (X) = Ô

(17.2.7)

определяет гиперэллипсоид в пространстве искомых пере менных {X}. Если теперь взять точки Xi (i = 1, . т\, равномерно распределенные внутри этого гиперэллип соида:

Я (Xi) < 8

(i = 1,

m),

(17.2.8)

то их среднее определяет центр гиперэллипсоида и, сле довательно, является оценкой решения X*:

Я .* =	~ S X,.	(17.2.9)
	г= 1
Очевидно, что в пределе при т		оо среднее (17.2.9)
является точным решением
X* =	lira Т т.	(17.2.10)
	771—>00

Задача, таким образом, сводится к отысканию случайных точек Xi, удовлетворяющих неравенству (17.2.8). Это проще всего сделать, используя случайный поиск, рас смотренный выше. Успех этого поиска в значительной мере определяется величиной вероятности Р. Если она мала, то целесообразность применения этого алгоритма

следует	ставить под сомнение.
При	отыскании минимума заданной функции Q =
= Q (X)	для целей экстремального управления приме

нение этого алгоритма явно не оправдано, так как связано с большими временными затратами. Причина этого заклю чается в том, что рассмотренный гомеостатический алго ритм случайного поиска решает вопрос об отыскании ре шения в принципе. Он лишь гарантирует конечность вре мени отыскания решения. Вопросы же быстродействия не решаются этим алгоритмом, так как он предназначен для управления объектами самого широкого класса с един ственным ограничением, связанным с конечностью вероят ности отыскания решения.

Однако в задачах экстремального управления часто имеются дополнительные сведения об объекте, напримёр о характере поведения его показателя качества при”раз личных управлениях. Эта информация дает возможность применить новые алгоритмы управления, уже решающие вопросы быстродействия с учетом имеющихся дополни тельных сведений об объекте. Такие дополнительные све дения об объекте оптимизации, прежде всего, несет его функция качества Q (X), которую требуется минимизи ровать. Нетрудно заметить, что сведения о гладкости ги перповерхности Q — Q (X) могут помочь в значительной степени убыстрить процесс оптимизации, так как при этом

<<< < Предыдущая 29 30 31 32 33 34 35 36 37 38 39 4041 / 6241 42 43 44 45 46 47 48 49 50 51 52 53 > Следующая >>>

Соседние файлы в папке книги

#
19.11.202348.22 Mб2Системы управления химико-технологическими процессами..pdf
#
12.11.20231.87 Mб11Системы управления электромеханическими исполнительными механизмами..pdf
#
12.11.20236.78 Mб12Системы управления электроприводами..pdf
#
12.11.20232.11 Mб11Системы управления электроприводом..pdf
#
12.11.20235.25 Mб3Системы централизованного теплоснабжения..pdf
#
19.11.202333.28 Mб10Системы экстремального управления..pdf
#
12.11.20233.1 Mб10Системы, технологии и организация услуг в автомобильном сервисе. Ч. 1.pdf
#
12.11.20233.11 Mб8Системы, технологии и организация услуг в автомобильном сервисе. Ч. 2.pdf
#
20.11.202323.11 Mб1Скважинная добыча нефти.-1.pdf
#
12.11.202320.25 Mб1Скважинная добыча нефти..pdf
#
19.11.202326.25 Mб22Скважинные насосные установки для добычи нефти..pdf