книги / Математические методы в системах поддержки принятия решений
..pdf3. Для любой задачи принятия решения должны быть
—установлены исходное множество элементов, цель или некото рая совокупность, целей и соответствующие им формализованные вы ражения критериев как функций, функционалов или как систем пред почтений, определенных на исходном множестве альтернативных элементов;
—описаны в математических терминах или в форме требований и отношений предпочтения исследуемые физические, экономические, производственные и другие процессы и ограничения;
—определены правила, методы и алгоритмы или аксиомы уста новления предпочтений на исходном множестве альтернативных эле ментов.
4.Под правилом установления предпочтительности на исходном множестве альтернативных элементов понимается принцип оптималь ности. Последний в полном виде раскрывается формализованным меха низмом — алгоритмом выделения из исходного множества альтернатив некоторого подмножества наилучших — оптимальных альтернатив в смысле необходимых и достаточных условий или систем аксиом их оп тимальности.
Отметим, что на практике приемлемыми для ЛПР могут быть почти оптимальные альтернативы (необходимость считать их приемлемыми обусловлена, например, возможными погрешностями в задании исход ной информации).
5.При сформулированном принципе оптимальности или системе аксиом задача выбора решения в математическом плане становится хо рошо структуризованной.
6.Конкретизации принципа оптимальности по содержанию и в ма тематической форме совместно с конкретизацией множества исходных альтернатив, требований и ограничений приводят к конкретным типам
иматематическим постановкам задач выбора решения; при этом выбор наилучших альтернатив составляет результат упорядочения исходного множества альтернатив посредством реализации необходимых и доста точных условий оптимальности или систем аксиом.
Так, пусть совокупность измерений описывается уравнением на блюдения г* = xt + V* к — 0, 1,..., N - 1 ; известна модель управляемого
динамического объекта или процесса в виде уравнения состояния*
* * н = <*>A + щ + W*.
где у*, wk — независимые нормально распределенные случайные адди
тивные возмущения, сопутствующие измерениям и движению объекта, и* — параметр управления, ик е U czE ',
хк — фазовая координата, хк е Е , к — текущий момент времени, п < 1 ,
Фк — 1x1 матрица, определяющая устойчивость и другие показатели
процесса; и критерий качества выбора решения задан в виде математи ческого ожидания функции потерь
41
+ ulQ 2uk
где Qo, 61 — симметричные неотрицательно определенные матрицы, Q2 — положительно определенная матрица. Тогда выбор оптималь
ного решения-управления и® может быть осуществлен в результате
минимизации критерия согласно принципу оптимальности Беллмана и принципу разделения (см. [57]); последний предписывает выполне ние минимизации критерия с целью выработки ик при условии вы
числения х к — прогнозированной оценки фазовой координаты на ка ждый момент времени к с минимальной среднеквадратической
ошибкой. Очевидно, названные принципы могут быть реализованы и в непрерывной динамической задаче выбора решения, т.е. когда урав нения наблюдения и состояния записываются в виде дифференциаль ных стохастических уравнений, а сумма в критерии — в виде интегра ла на отрезке времени [f0, 7], t0 = ка, T = N. Отметим также, что по оценкам х к, соответствующим им ик и значениям критерия можно
принять решение о нормальном либо опасном режиме функциониро вания управляемого объекта.
Г л ав а в т о р а я
Необходимые и достаточные условия оптимальности выбора решений при определенности
2.1. Необходимые и достаточные условия оптимальности для скалярного механизма в статических задачах
Скалярный механизм вводится для выбора лучшего решения х° или У(х) по достижению одной единственной цели согласно скалярному функционалу качества Дх) или F(y(x)) из неограниченного множества возможных решений Х = R" или из соответствующего функционального пространства Е и записывается в виде
х° € Arg m in/(x) |
(1) |
хеХ |
|
ИЛИ |
|
у°(х)е Aig т т Л Д х ) ) , |
(2) |
у(х)е£ |
|
где Е — пространство непрерывных функций или пространство непре
рывных функций, обладающих непрерывными производными;
F(y(x)) — функционал интегрального типа в пространстве Е, где х принимает значения из ограниченной области G, в простейшем слу чае — из [а, Ь].
Рассмотрим сначала необходимые условия для механизма (1). Здесь fix) — ограниченная функция потерь, которая может быть дифференци
руемой, непрерывной или даже разрывной. Из физических соображе ний и при выпуклой функции Дх) наилучшему решению х° соответству ет условие
Дх°) <Дх), х е Х .
Это условие можно записать по-другому
Дх) - Дх°) > 0, х е X, или Дх) -Д х°) > (0, х - х°),
где в правой части записано скалярное произведение нулевого вектора на вектор (х — х°) и 0 есть значение субградиента функции Дх) в точке
43
х° — субградиента как элемента из множества ЭДх°) — субдифференциа ла функции fix ) в точке х°, т.е. О е ЭДх°).
Определение 1. Выпуклая функция f(x) имеет в точке х° субградиент а, если выполняется соотношение
f i x ) - f i x 0) > (а, х - х°) Vx € X.
Определение 2. Множество всех субградиентов функции f(x) в точке х° называется субдифференциалом df(x°)
Итак, необходимое условие оптимальности выбора решения х° по скалярному механизму (1) записывается в виде 0 е ЭДх°). Это условие реализуется при различных критериальных функцияхfix): дифференци
руемых, непрерывных, почти выпуклых. Для этих функций необходи мое условие оптимальности решения (альтернативы) х° является и дос таточным.
В некоторых выпуклых задачах выбора решений может оказаться полезным использование сопряженной — двойственной критериальной функции, т.е. использование не точечного способа задания выпуклой функции, а задания посредством касательных к ней гиперплоскостей в R". В таком случае исходная функция представляется верхней огибаю
щей системы касательных плоскостей. Так, если Дх) строго выпуклая и гладкая, то для каждой ее точки существует единственная касательная плоскость, определяющаяся своим нормальным вектором. Тогда задан ную функциюfix) можно представить точками пересечения касательных плоскостей с координатной осью значений функции fix), т.е. с (п + 1 )-й
осью системы координат.
Для рассматриваемой исходной функцииfix) допустимо считать, что (п + 1 )-я компонента нормального вектора равна —1 и все другие его компоненты составляют вектор у, длина отрезка, отсекаемого касатель ной плоскостью от (и + 1 )-й координатной оси, равна При этом зада ние функции fix) посредством касательных плоскостей записывается в виде %= у(у). Так как исходная функция гладкая, то уравнение каса тельной плоскости в точке xk е R" принимает вид
§ —fixk) = ( х - xk)Tf '{ x k), х 6 R”.
Длина отрезка (п + 1)-й координаты определяется из уравнения плоскости при подстановке х = 0, т.е. %к - f ( x k) - x Tk f '( x k).
Теперь воспользуемся выражением для координат нормального к касательной плоскости вектора
из которого получаем, что у = f x'(xk), откуда х к = f f i 1(у). В результате
получаем другое выражение для %, оно записывается в виде классическо го преобразования Лежандра [14; 15]
44
$ = /( У Г '0 ' ) ) - 0 'г ,Лн 0 ')),
где в последней скобке записано скалярное произведение. Так, напри мер, преобразованием Лежандра связываются производственная функ ция и прибыль в задаче п. 1.2. Это преобразование обладает важным свойством: антиградиент сопряженной функции £ = VOO равен обрат ному градиенту исходной функции, что проверяется непосредственно вычислением градиента функции % по правилу ее дифференцирования
как сложной функции. Выражение необходимого условия оптимального выбора решения не изменяется и имеет вид 0 = у '(у ° ), при этом пере
ход от альтернативы у° к альтернативе х° осуществляется по выражению * ° = / ; V ) (см.[14]).
Проиллюстрируем применение преобразования Лежандра в следую щей задаче выбора решения, например, как задачи квадратичного про граммирования.
Задача. Найти
vo aig min /(* ) = atg minf -(* , Bx) + (c,x) 1, X*= {* e RP | <p(x) = Ax + d < 0},
|
xeX |
xeX\2 |
J |
где (x, Bx) — положительно определенная квадратичная форма, |
|||
В —симметрическая матрица размера п хл |
|
||
А — п х т |
матрица с элементами aiJt / - 1 , |
2 , у = 1 ,2,...»/я, |
|
f d\ ^ |
|
|
|
d = |
вектор-столбец заданных чисел. |
|
Р е ш е н и е . Составим целевую |
функцию \ L двойственной задачи, т.е. составим |
|
функцию |
вида |
|
|
т |
|
|
Цх,Х) = f( x ) + |
j(x) = Д х ) + (АгХ,х) + (d,X), |
у-1
где X е Rm — вектор неопределенных множителей Лагранжа, и отметим, что из maxL(x,X)
хеХ
следует ограничение V/(.x) + АТх - 0. Тогда задача отыскания решения записывается в виде
maxZ(x,X) при ограничении VJ(x) + А Ч = О, X't 0.
Выполним преобразования над L(x, X). Воспользуемся свойством: при сильной вы пуклости функции f[x) уравнение Щ х ) = у имеет единственное решение х = V/ - 1(у). Под ставим это решение в уравнение V/fr) + А Ч - 0 и учтем, что А Ч = - Щ х ) = -у; в резуль тате получим выражение для \ L - I( JC, X),
^ = / ( / д Г 1(^ ))-(У г ./дГ'(>'))+(</Д), при э т о м Л + у = 0.
45
Так как здесь у - / ( * ) = Вх + с, то получаем х = / _1(у) = |
- с); и выражение для |
*>L=-<yT,B-l( y - c ) ) + i ( B - l( y - c ) , ( y - c ) ) + (c,B-l( y - c ) ) + ( d , \ ) =
= ~ « y - c ) , B - l( y - c ) )+ ( d ,\),
где первое слагаемое есть отрицательно определенная квадратичная форма. Итак, двойственная задача выбора решения имеет вид
/ = а Чт а х ^ )У={^еЛ',|у|гХ+^ = 0, 31*0},
при этом искомое решение
Х° = f ' - ]( y ° ) = B ~ \y ° - с ) и max£L = min f(x).
Классическое преобразование Лежандра есть важный частный вид операции сопряжения выпуклых непрерывных функций, не обязатель но всюду дифференцируемых на области их определения, и отмеченное выше свойство представляет следствие взаимно однозначного соответ ствия субдифференциалов, вычисленных в сопряженных точках (аль тернативах) исходной и сопряженной функции. Точки х и у называются сопряженными, если удовлетворяется условие у (у) +Д х) = (ут, х).
Таким образом, двойственность 0 е ЭДх) о 0 е Эу(у) есть другая
форма выражения необходимых и достаточных условий оптимального выбора решений при использовании скалярного механизма.
Перейдем теперь к формулированию необходимых и достаточных условий оптимальности решений при использовании скалярного ме ханизма вида (2). Следуя физическим соображениям и учитывая вы пуклость функционала F(y(x)), запишем условие для наилучшего ре
шения у°(х)
F(y(x))>F(/(x))
для любого х из заданной области, где у(х) е е и е — класс непрерывных и гладких функций.
Если функционал F(y(x)) дифференцируем в точке у°(х) и достигает
в ней минимума, то его первая вариация 5Ду°(х), А°(х» = 0 при любом приращении А°(х). Этот факт составляет необходимое условие
min/Xy(x)), доказательство дано, например, в [16]. Если функционал
е
F(y(x)) дважды дифференцируем, то в точке минимума его вторая ва
риация неотрицательна при любом приращении А°(х) функции у°(х), т.е. 52F(y°(x), й°(х)) > 0. В развернутой форме необходимое условие записы вается для F(y(x)), например вида
ь
а
46
следующим образом:
5F (y°(x),h°(x)) = |
^ h(x)dx = 0, |
i |
дУ |
что удовлетворяется только при условии
Э/(х,у°(х)) _ р |
(3) |
ду
при любом х, а й х й Ь , и когда функция Л(х) непрерывна вместе со своими производными, неотрицательна на [а, 6], Л(о) = h(b) = 0 и равна нулю вне промежутка [а, Ь\. Достаточное условие имеет вид
82F (y°(x),h°(x))= |
(*>)/»2(х)& 2:0 |
i |
Эу |
при любом приращении А°(х), т.е. необходимо, чтобы
Э7 ( х , / ( х ) ) ^ 0
ду2
Если функционал качества принятия решения имеет более сложный вид, например
ь
F(y(x)) = Jf(x,y(x ),y'x (x))dx,
то первая вариация |
|
8F(y(x),A(x)) f[V (x ,y ,y ') d |
Э/(х,у,уО h(x)dx |
dx |
ду' |
и необходимое условие 8F(y(x), А(х)) = 0 преобразуется к виду диффе ренциального уравнения Эйлера
d f(x,y,y') |
d |
Э/(х,у,уО |
Эу |
dx |
(4) |
ду' |
или
/у у У " + / у у ’ У ' + / х у • - / у =0-
Может оказаться, что среди решений этого уравнения не будет тех, которые бы удовлетворяли поставленным в задаче условиям у(а) и у(Ь).
47
Так, в примере Вейерштрасса j t 2x 2dt-> inf дс(0) = 0, х(1) = 1, уравнение
d |
о |
С |
|
Эйлера — (2/ 2х 2) = 0 |
и его общее решение x(t) = — +С, не выводит на |
dt |
t |
экстремали, удовлетворяющие условию х(0) = 0. В этом случае задача
принятия решения не имеет решения в классе е дважды дифференци руемых функций. В случае наличия решения условие для второй вариа ции b2F(y(x), h(x)) > 0 в точке минимума преобразуется к виду условия Лежандра
Э2/ ( х , / , / ' ) |
при любом х, а < х < Ь , в точке у°(х). |
|
Эу ' 2 |
||
|
Заметим, что если функционал F(y(x)) достигает в точке у°(х) мини
мума по отношению к точкам у(х), близким к /( х ) по ординатам и на правлениям касательных, то имеет место слабый минимум; это обстоя тельство представляет существенное значение для установления достаточных условий минимума, когда функционал Я(у(х)) задан в про странстве непрерывных кусочно-гладких функций (е = Ct(a, Ь))
(см.[17;18]) и дифференцируем по Гато или по направлениям. При этом необходимое условие (3) следует записать в виде 0 е ЭДх, у°(х», где dfix, У(х)) — субдифференциал функции fix , у(х)) в точке у°(х).
Это условие имеет другую эквивалентную форму записи:
т ,„ № . / < * » 20|
И -1 dg
где g — направление, по которому вычисляется производная функции fix , у(х)) в точке /(х ).
Уравнение (4) в пространстве кусочно-дифференцируемых функций преобразуется к виду
/*(*) = «» УФ), уф ), у х(х) € ЭЯ(х, / , и, у), где Э Я (х,/(х), и, у) — субдифференциал функции Гамильтона
Щх, у(х), и, у) = fix, у(х), и) + уи , и € R',
УФ)> УФ) — граничные условия, которым должно удовлетворять иско мое решение у°(х).
Действительно, при введении условия у\(х) = и функционал F(y(x))
ь
записывается в виде F(y(x)) = | f(x,y(x),u)dx. Но тогда отыскание у°(х)
а
есть результат решения задачи F(y(x)) - » min при условии /*(х) = и,
48
a < x < b . Это есть задача оптимального управления в понтрягиновской
форме [27;37;51].
Функция Щх, у(х), и, у) удовлетворяет условию выпуклости по у(х) для любых х; очевидно, по у эта функция всегда выпукла. Здесь V = \Дх) — вектор-функция, удовлетворяющая известным [27] условиям принципа максимума Понтрягина: она является решением сопряженного
уравнения
V i = -Н 'у(х,у(х),и,у)\и(х),у(х),
соответствующего паре и(х), у(х); х е [а, Ь\\ здесь принято, что функция
Н(х, у(х), и) = -Д х, у(х), и) + щ
дифференцируема по у.
Правило решения такой задачи заключается в выполнении следую щих действий:
1 . Составить функцию Гамильтона—Понтрягина Н (х,у(х), и).
2. Выписать сопряженную систему
у'х = -Н 'у(х,у(х),и,у) |к(х),у(х).
3. Определить оптимальное управление из необходимого условия
sup Н (х,у(х),и ,\|/), х 6 [а, Ь]. ueRtt
4.Подставить оптимальное «° в дифференциальные уравнения для у
иу и проинтегрировать их при начальных и конечных условиях для у и
условиях трансверсальности — для у .
2.2. Необходимые и достаточные условия оптимальности для условно-экстремального механизма в статических
и вариационных задачах
Условно-экстремальный механизм в статических и вариационных задачах вводится для выбора лучшего решения хР или /( х ) по скалярно му функционалу качества Дх) или F(y(x)) из множества возможных ре шений (альтернатив) X a R " , ограниченного системой равенств и/или неравенств <р,{х) £ 0, / = 1,к, <р,(х) = 0, / = k+ l,m , х е R 1, или из соответст
вующего функционального пространства е при существовании огра
ничивающих связей ф,(у(х)) = 0, i - 1,1 на функцию у(х). |
Механизм |
записывается в виде |
|
х° е Arg m in/(x), |
О) |
хеХ |
|
4 - 5396 |
49 |
|
X = {хе А”|фД х) £ 0,/ = 1X ф, (х) = 0, i = k + 1,т] |
|
или в виде |
|
|
|
у °(х)е Aig min F(y(x)) |
(2) |
|
у(*)«е |
|
при условии, что |
|
|
|
ф/ОФО) = о, / = 1,/, |
|
где |
ф,(у(х)) может представлять конечную связь, причем |
все связи |
/ е |
[1 , 1\ — независимы. ф,(у(х)) может записываться также в интеграль |
ном виде или, что то же самое в терминах дифференциальных уравне ний, т.е. ф,(у(х» в этом случае представляет дифференциальную связь и все такие связи — независимы.
Рассмотрим необходимые условия для механизма ( 1 ). Будем счи тать, что X — выпуклое множество, а функция Дх) обладает теми же
свойствами, что и в предыдущем параграфе. Для установления необхо димого условия оптимальности решения х° предварительно введем на
множестве X индикаторную функцию |
|
|
ГО |
если |
х е X , |
«о, |
если |
х е Х . |
Геометрически функция 5(х(А) представляет полуцилиндр с основанием X. Далее составим функцию ф(х) =Д х) + 8(х(Л); эта функция очевидно
определена на всем пространстве Л" и выпукла, так как
/(х ), |
если |
х е Х , |
ф(х) = |
если |
х « X , |
о», |
и субградиент функции ф(х) для выпуклой задачи равен сумме субгра диентов функций Дх) и 8(xjA), т.е. Эф(х) = ЭДх) + Э8(х)Л). Выпуклость множества X равносильна выпуклости индикаторной функции 8(х|Л), а последняя является сопряженной к опорной функции 8'(х|Л) множества X в точке х е X.
Определение [19; 20; 21; 22]. Опорная функция 8*(х)Л) выпуклого мно жества X определяется выражением
8*(х|Я) = su p |(x ,y)|ye Х ' \ ,
УJ
где у — субградиент в точке х, или у — опорный вектор. Если граница мно жества X описывается непрерывно дифференцируемой функцией, то суб градиент переходит в производную и
8*(х|Л) = {(х,ф'(х)) £ р| ф'(х) * 0}.
50