Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами

.pdf
Скачиваний:
6
Добавлен:
22.10.2023
Размер:
12.44 Mб
Скачать

(ЛГ l ) + 2 n

(N-l)

+ n

 

V

X.

i

l=N

1,

а 2 , Л' + l

а 2 , N~\

2, г

2

Ч І

j =

N+n

 

2

 

 

(N-l)+2n

4. Завершение опознавания. В случае обнаружения нарушения нормальной работы отсадочной машины выдается оповещающий сигнал диспетчеру фабрики (оператору главного корпуса). Про­ цесс опознавания не прерывается.

Контроль

исправности

датчика

шума

 

 

1. Запись констант и условных

обозначений:

 

Хі

— шум

мельницы, %

 

шкалы

показывающего

прибора;

Х2

— производительность

агрегата, т/ч;

 

Хз — расход воды в отсадочную машину, м3 /ч;

 

аі = 0,001

I коэффициенты

аппроксимирующего

уравне-

й2

= 0,001

J

ния;

 

 

 

 

 

і,/=1,

2,

3,

...,

п — порядковый

номер замера мгновенных

 

 

значений параметров х\,

Хг с интервалом 1 мин;

и = 10 — число замеров параметров Хі и х2;

 

N=

1, 2, 3 . . . — число экспериментов;

 

Sign(p(x) =

[—]датчик шума

неисправен;

 

Sign ф (л:) =

j + ] датчик шума

исправен.

 

183

2. Опознавание ситуации. Производится по уравнению

 

 

 

 

 

 

 

(УѴ— 1 ) + я

 

 

 

 

 

( N — 1 ) + 2 л

 

 

 

y = signcp(.v)=sign

 

2

 

 

 

 

< —

2

Хх<

І

 

 

 

 

 

( J V — 1 ) + 2 я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

•(N-l)

+

n

 

 

 

l = N

+

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

тѵ '

 

 

^ |

 

-*2, ('

 

 

 

(N—

I )

+ 2 / 1

*2,

j

\

~

 

 

4,

 

 

N

 

 

^

 

 

 

 

 

 

 

 

 

i =

 

 

 

 

 

j =

N+n

 

 

 

J

 

 

 

 

 

' ( Л Г - 1 ) +

п

 

 

(ЛГ—1)

+

 

 

 

 

 

 

 

 

 

 

 

 

X*3,. ;; —

 

 

2

 

 

-XT;- ѵ з,

/

 

 

 

 

 

 

 

 

i =

N

 

 

 

 

j

= N

+

n

 

 

 

 

 

 

3.

Корректировка коэффициентов. Производится по формулам:

 

 

 

 

 

 

 

/(N—

 

 

1 ) + я

 

 

 

 

(N—\)

+

2n

 

 

 

 

 

 

 

'

 

2

 

 

 

! —

 

2

л

У

 

 

sign yN

— sign

 

і =

 

,/Ѵ

 

 

 

 

 

. / ^ J V +

 

 

 

 

 

 

 

 

( W — 1 )

+

2 я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

\

 

 

 

 

 

i =

N+n

 

 

 

 

а 1 , ЛГ + 1 # 1 , Л Г

 

 

 

 

 

(N—\)+2n

 

 

 

 

\ 2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l = N+n

 

 

 

J

 

 

 

 

 

 

 

 

'(N—l)+n

 

 

 

 

 

(N—\)+2n

 

 

 

 

 

 

" a i , лг-ТГІ

 

 

2

 

г—

 

2

 

 

xî,

J

 

 

 

 

+

.

i = N

 

 

 

 

 

j =

N

+ n

 

 

 

 

 

 

 

 

(У Ѵ - 1 ) + 2я

 

 

\ 2

 

 

 

 

 

 

 

 

 

 

 

U-

2

 

 

-M +

 

 

 

 

 

 

 

 

 

 

 

n

(, = N +

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 ' ( J V - l ) + n

 

 

 

( W - l ) + 2 «

 

 

 

 

 

 

 

 

 

 

 

2, N

2 х з , i 2 Х З -

J

 

 

 

 

 

( N — 1) + 2я

 

 

i = N

 

 

 

 

j=:N+n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I ,

< Л Г - 1 ) + 2л

 

 

 

 

 

 

 

 

 

 

 

X 2 , «,

 

+

4 -

 

 

2

 

- з . г

 

 

 

 

 

 

 

 

 

 

 

( =

Л + я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г=/ѵ+n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(N—l)

2

+

n

 

 

 

 

 

 

(N—l)+2n

-"-b У

 

 

 

 

 

 

 

 

 

 

x l , l ~

 

 

2

 

 

sign ?лг—sign

 

i =

N

 

 

 

 

 

j =

N+n

 

 

 

 

 

 

 

 

 

(N—l)

 

+2n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

Л 2 . N+l

a 2 , N '

 

 

 

 

 

(TV— 1 )

( =

ЛГ +

я

 

 

 

 

 

 

 

 

 

 

+ 2 я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=N2+ n

 

 

*

i .

*

 

+

 

 

184

' ( Л Г - 1 ) + л

 

( Л Г — l ) - f - 2 n

 

1 I

V

,

 

 

 

 

 

1, N '

_

2,

;

j =

N+n

 

 

 

 

 

 

 

, (N-l)+2n

 

\ 2

 

 

 

"

i = N +

n

 

 

 

 

 

 

(N—

2

l)+2n

 

 

 

2, TV '

 

 

Л

3 ,

y

 

• a,

 

 

 

2n

 

 

j =

N

+ n

 

(N — l ) +

 

 

 

 

 

(ІѴ— l ) +

2n

 

 

 

i = N +

л;.з. f

+ —

S

* 3 ,

 

 

 

n

 

 

 

 

 

i — N-T- n

4. Завершение опознавания. В случае обнаружения неисправной работы датчика выдается оповещающий сигнал диспетчеру фаб­ рики (оператору главного корпуса) и прерывается работа первой

итретьей частей алгоритма.

И1.7. ОПТИМИЗАЦИЯ УПРАВЛЕНИЯ ФЛОТАЦИОННЫМИ ПРОЦЕССАМИ

Результатом рассмотрения вопросов управления флотацион­ ными процессами явилась постановка задачи оптимизации в нату­ ральном масштабе времени, выбор целевой функции управления и алгоритм расчета статической модели управляемого процесса

ввиде полинома (III.78).

Влитературе имеется очень немного предложений по оптими­ зации флотационных процессов в натуральном масштабе времени.

Значительное число работ посвящено статической оптимизации с последующим усовершенствованием технологических схем и реагентных режимов. Обсуждение этих вопросов выходит за рамки настоящей книги, и на них мы не останавливаемся. Укажем лишь, что наибольшее распространение получили известные и уже ранее упоминавшиеся методы Бокса—Уилсона и эволюционного планиро­ вания (так называемый «ЕѴОР»),

Вработе [286] указывается, например, что в системе управле­ ния флотационным процессом на фабрике Цинк Корпорейшн (Австралия) использовались методы оптимизации типа прямого по­ иска и «крутого восхождения». Однако эта работа не содержит сведений о применяемых алгоритмах. Поэтому не представляется возможным оценить их достоинства и недостатки. То же можно сказать о более ранней работе [79], где приводится лишь схема алгоритма управления процессом флотации угля без указания при­ меняемого метода оптимизации.

Вэтом плане выгодно отличается работа [217], где обсужда­ ется возможность приложения к задаче оптимизации флотацион­ ного процесса в натуральном масштабе времени метода стохасти­ ческих аппроксимаций, предложенного Кифером и Вольфовитцем

185

[278]. Причем автор работы [217] (с чем мы также согласны) за­ нялся отысканием подходящего метода потому, что метод Бокса— Уилсона для этих целей оказался не совсем эффективным, так как слишком высок уровень шумов рассматриваемых процессов.

Метод стохастических аппроксимаций лишен этого недостатка. Однако он обладает другим, не менее существенным недостатком — его эффективность резко убывает с увеличением размерности опти­ мизируемого процесса.

В самом деле, сущность метода, предложенного в работе

[217],

состоит в том, что для некоторой неслучайной

входной величины

(управляемый параметр), начиная с произвольного

значения

уи

последовательно

определяются

значения у г, ...,

уп,

так что уп

 

схо­

дится в некоторой точке Ѳ, в которой выходной параметр

и в сред­

нем имеет максимум. Предполагается, что величина и

имеет

(хотя

и неизвестное)

условное распределение H (и/у),

а

математическое

ожидание M (и/у)

принимает

максимум

строго

в точке

Ѳ,

т. е.

функция

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

со

 

 

 

 

 

 

 

 

 

 

 

 

—со

 

 

 

 

 

 

 

 

максимальна в точке Ѳ.

 

 

 

 

 

 

 

 

 

Для

многомерных процессов {у}

= у^\

уѴ\

...,

ут

(Ѳ — тоже

многомерная) приращения даются каждому входу

по очереди,

на­

пример, для z/W приращения даются

при

фиксированных

у&\ ...

..., z/m ) .

Таким

образом, для

этих

значений у&\

...,

г/<га)

отыски­

вается

max M

(и/у).

 

 

 

 

 

 

 

 

 

Такой единичный поиск необязательно приведет к максимуму выходной величины по всем управляемым параметрам, т. е. к max M («/y). Следовательно, для его отыскания придется много­ кратно повторять поиск.

Если учесть, что последующий поиск производится лишь после измерения величины выходного параметра и в установившемся ре­ жиме [217], то время поиска оптимальных значений всех управ­ лений становится недопустимо большим, что и определяет малую эффективность данного метода при большой размерности {у}.

В начале 60-х годов [123, 124] были предложены игровые алго­ ритмы оптимизации разделительных процессов сущность которых

1 Выбор игровых алгоритмов оптимизации для построения систем управле­ ния этими процессами не является неожиданным. Еще в 1956 г. Эшби В. Росс

[257] отметил, что поведение любой

системы регулирования

(управления)

можно описать таблицей исходов, которая

тождественна платежной

матрице соот­

ветствующей игры.

 

 

Нужно сказать, что 60-е годы характеризуются повышенным интересом ис­ следователей к теории игр при решении различных задач оптимизации. Так, при­ мерно в то же время М. Б. Гаджиев [47] предложил решение задачи о пресле­ довании, аналогичное задаче отыскания оптимальных стратегий в случае конф­ ликтной ситуации, т. е. когда управляющее воздействие выбирается двумя противниками. Один из них минимизирует, а другой максимизирует суммарную

186

состоит в том, что процесс выбора оптимальных технологических режимов представляется как игра двух групп лиц: первая группа лиц {х} представляет интересы природы (игрок X), которая, во­ обще говоря, относится безразлично к платежам. Вторая группа лиц {у} (игрок Y) стремится максимизировать свои выигрыш. Стратегиями (чистыми) природы являются всевозможные наборы

параметров xi, х%, • •-,

хи, стратегиями группы

{у}—наборы

у\,

уг,

• •., у т. Платежной

функцией игры является

К(хі, ..., Xk,

уи---

...,

у m) в виде полинома (III.80).

 

 

 

 

Процедура игры состоит в том, что оба игрока X и Y играют

бесконечное число партий (точнее, играют, пока существует

данный

управляемый процесс). Причем в каждой партии игроки

делают

по одному ходу, применяя любую из своих стратегий — численных наборов значений x i , xz, . • -, Xh для игрока X и наборов уи у-і, ...

..., ут для игрока Y. Расчет производится после каждой партии в со­ ответствии с заданной платежной функцией К{х, у).

Решение задачи отыскания оптимальных управлений в случае флотационного разделения (оптимальных реагентных режимов) можно свести к трем основным типам игр:

игра

без информации. Члены группы

{у} применяют свои стра­

тегии, не имея информации о примененной

природой стратегии;

группе {у} известны смешанные стратегии природы;

 

случай полной информации, соответствующий положению, когда

всякий выбор

стратегий {у}

связывается

с безусловным

знанием

примененной чистой стратегии

природы.

 

 

 

Решение этих типов игр можно провести как в непрерывной

форме (бесконечные

игры), так и в дискретной (матричные игры).

 

 

Построение

систем

управления

 

 

 

при

решении

непрерывных

игр

 

Выше была определена математическая модель флотационного

процесса

в виде некоторой поверхности отклика К (хі, ...,

х%, у и ...

ут),

заданной в

пространстве

значений параметров

х%, ..., хг

и у и ...,

ут,

определяющих процесс и отвечающих условиям

 

 

 

 

 

 

 

 

(Ш.214)

 

 

 

0 < У ; < ^ ;

7 = 1 ,

m,

(III.215)

где й{, bu Cj, dj — границы изменения параметров ХІ и у у

плату. В. Ю. Крылов и М. Л. Цейтлин [108] рассмотрели задачи, характерные при игровых ситуациях, для ограниченного числа конечных автоматов. Причем одну из задач [237] — поведение автоматов при игре с природой — М. Л. Цейт­ лин решил еще в 1960 г., применив почти игровую терминологию — «Штраф— нештраф». Интересные исследования проведены позднее Ю. А. Кочетковым [102] по выбору управлений.

В последние годы проводятся работы по использованию теории игр как перс­ пективного метода оптимизации.

187

При этом параметры {х} представляют собой возмущения си­

стемы

и являются случайными

стационарными (в

широком смы­

сле)

функциями

времени,

а

{у}—параметрами

управления.

Принимается, что функции распределения случайных процессов

X(t)

={xi(t),

 

Xk(t)}

 

и

Y(t)

=

{yi(t),

ym{t)}

соответствуют

F ( X i , ...,xh)

и

G(г/і,

y m

)

. *

 

 

 

 

В дальнейшем задачу отыскания оптимальных режимов пред­

ставляем в виде игры с платежной

функцией

 

 

К[х,

у)

=

2

 

.

a

i

t j

j

• • - *i*x

 

 

 

 

lk-

h

 

Jm

 

 

 

 

 

 

 

 

 

 

Xy\\

• • -, У™-

 

(Ш.216)

Решение игры и схема управления без информации. Управляю­

щие системы флотационных процессов представляют собой системы с неполной информацией; характерным для них является отсутст­

вие полного описания «поведения» в процессе управления,

так как

в этих описаниях трудно (или невозможно) учесть влияние

многих

факторов, существенно влияющих на ход процесса. Поэтому при построении модели игры можно представить, что управляемый про­

цесс ведет себя как игрок, применяющий

свои

стратегии (наборы

значений параметров

{х})

на

основании

некоторого,

неизвестного

игроку У закона распределения

F (X)

=F(xi,

...,

хи, который может

с течением времени

либо

меняться,

либо

оставаться

неизменным.

Максимизирующий игрок У (оптимизирующая система) должен вы­ работать для этих случаев оптимальную линию поведения.

Здесь рассматривается игра без информации с природой, кото­ рая представляет собой игрока бернуллиевского типа [176], т. е. иг­ рока, не использующего никакой информации о результатах игры. Иначе говоря, решения игры в предположении, что игрок X, раз применив стратегию с распределением F(X), в дальнейшем ее не меняет.

Это весьма важный случай, так как основные возмущающие факторы технологических процессов флотационного разделения представляют собой стационарные случайные функции времени,

обладающие свойством

эргодичности.

Как известно [43,

182, 196], для того чтобы убедиться в этом

в каждом конкретном

случае, достаточно найти для возмущающих

воздействий пределы

их нормированных автокорреляционных

функций

j

 

lim

[

K(t)dx.

Т -». оо

j

 

* Представление технологических режимов как случайных процессов может показаться необоснованным. Однако примерно с такой ситуацией исследователи столкнулись при решении некоторых задач в теории выбора статистических ре­ шений, на что обращает внимание Д ж . Нейман [162]. Такое допущение оказа­ лось удачным.

188

Если такой предел оказывается равным нулю, то данная слу­

 

чайная функция обладает свойством эргодичности.

 

 

 

 

 

Примеры определения эргодического свойства некоторых пара­

 

метров обогатительных процессов

можно

найти в работах

[27, 28],

 

а также

в книге

И. Г. Гринмана

[61], где нормированная

автокор­

 

реляционная функция содержания меди в руде одной из обогати­

 

тельных

фабрик

интерполируется

 

функцией К (т) = /~°'1 7 т ,

так

что

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

Обычно решение игры без информации начинается с отыскания

 

седловой

точки

 

[64,

146]. Поиск

ее

состоит

в

нахождении

 

max min К { х ,

 

у }

и

min max К

{

х ,

у

} . Если

max min К { х

,

у } =

у х

 

 

 

 

X

у

 

 

 

 

у х

имеет

сед-

 

= minmax/C{x,

у }

= К {

х а ,

г/о}, то

платежная функция

 

X

у

точке

{хо,

г/о}, которая

определяет

пару оптималь­

 

ловую точку в

 

ных стратегий:

0} — для

игрока X

и {г/о} — д л я игрока Y. На этом

 

решение игры

заканчивается.

 

 

 

 

 

 

 

 

 

Процедура поиска седловой точки платежной функции вида (III.216) для каждого конкретного случая в принципе известна, однако дать алгоритм ее отыскания в общем случае пока не уда­ ется. Определение такого алгоритма желательно, но не обяза­ тельно, так как, во-первых, наличие седловой точки для платежной функции К { х , у } большой размерности весьма маловероятно, а, вовторых, практически мы чаще всего сталкиваемся с играми, когда известны априорные распределения параметров {х}.

Здесь следует также указать замечание М. Дрешера о проверке

дискретных игр на седловую точку

[64], которое состоит в том,

что практически отыскание седловой

точки важно лишь для игр

с платежной матрицей малой размерности, так как увеличение ее

ведет к резкому уменьшению вероятности существования

седловой

точки

и для

игр

(mXm),

когда

( т > 1 0 0 )

эта

вероятность исче-

зающе

мала.

 

 

 

 

 

 

 

 

 

Рассмотрим наиболее интересный случай, когда

 

 

 

 

max min К

{х, у] <

min max К

\х,

у],

(111.217)

 

 

 

у

X

 

 

X

у

 

 

 

т. е. когда игра не имеет седловой точки.

 

 

 

Перепишем

платежную функцию

(III.216)

в виде [121]

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

 

 

К(Х,

УГ=2РГ(Х)0Г(П

 

 

 

(III.218)

где Х={ХІ,

...,

Xk}

и

К =

{г/і, ..., ут}—множества

соответствую­

щих параметров; РГ(Х)

и QR(Y) —некоторые

многочлены.

 

Игрок X использует в качестве чистых стратегий точки /^-мер­

ного параллелепипеда

Rk,

определенного соотношением

(III.214).

189

Аналогично игрок Y использует в качестве чистых стратегий точки

m-мерного параллелепипеда Sm: c^t/j^df, / = 1 т (III.215) и, как указывалось ранее, должен применять такие стратегии, кото­ рые давали бы максимально возможный выигрыш.

 

Игра

без

информации характерна тем, что, решая ее,

игрок Y

не

знает,

с

каким распределением F(X)

применяет

игрок

X свои

чистые стратегии из всех возможных, содержащихся

в Rh- Игрок Y

в

принципе

может применять свои чистые

стратегии

из Sm

любым

способом, например в соответствии с некоторой функцией распре­

деления G(Y). В таком

случае выигрыш игрока

У определится со­

отношением [64, 121, 146]

 

 

 

E(G,

F) =

j j K{X,

V)dO(Y)dF(X).

(III.219)

Но игроку Y нужно максимизировать свой выигрыш; ему пред­

стоит

применять

свои стратегии таким образом, чтобы величина

E(G

, F ) , подсчитанная

по формуле

(III.219),

была наибольшей.

Иначе говоря, задача состоит в определении оптимальной смешан­ ной стратегии G*(Y).

Можно показать [64, 146], что оптимальные стратегии игрока Y представляются в виде выпуклых линейных комбинаций чистых стратегий. Коэффициенты при этих стратегиях есть частоты, с ко­ торыми применяются чистые стратегии [269].

Следовательно, для того, чтобы игрок Y мог играть наилучшим

для себя

образом в ситуации, когда он не может получить инфор­

мации о

стратегии, примененной

природой, в

его

распоряжении

должен быть случайный механизм, вырабатывающий

оптимальное

распределение частот (Pj) применения чистых

стратегий, соответ­

ствующее функции распределения

G*(Y).

 

 

Известны несколько способов получения случайных чисел с за­ даваемыми по желанию законами распределения [75, 103, 122, 170]. Кроме того, в качестве случайного механизма в системе управления можно использовать и цифровую вычислительную машину [63, 70].

Возвращаясь к поставленной задаче, вспомним, что в разбирае­ мой игре одним из игроков является объект управления — природа,

а

вторым — оптимизирующая

система,

вырабатывающая

команды

на

управление регуляторами

подачи

реагентов

в соответствии

с распределением (Pj).

Причем, в данном случае

устройством вы­

работки управляющих

воздействий служит случайный

механизм.

Структурная схема системы управления разделительной уста­ новкой (технологическим контуром) для рассматриваемого случая чрезвычайно проста [121] (рис. III.33) и несколько необычна — для реализации алгоритма управления не нужна система контроля тех­ нологических параметров в темпе с процессом, а управляющая информация формируется случайным механизмом (например, в виде номера реагентного режима). Командное устройство в соот­ ветствии с номером стратегии формирует задание на регуляторы

190

подачи реагентов (стратегиями управления являются численные наборы параметров yf, yf, ..., гу«).

Система предполагает дискретное управление. Задание на регу­ ляторы остается постоянным на промежутке времени AT, равном минимальному из шагов квантования по времени функции xi(t), xz(t), . • -, xk(t).

Очевидно, точность регулирования процессов разделения при такой схеме управления зависит прежде всего от того, как точно отражает все возможные состояния системы платежная функция (III.216). Очевидно также, что в случае, когда технологический процесс выходит за нормы, установленные условиями управления (III.214), применение рассчитанной смешанной стратегии вероятнее всего неоптимально, хотя вполне возможны случаи удачно выбран­ ных чистых стратегий.

Рис. III.33. Структурная схема системы управления технологическим контуром при отсутствии текущей информации:

/ — о б ъ е к т у п р а в л е н и я ( т е х н о л о г и ч е с к и й к о н т у р ) ;

 

 

 

 

 

 

2 — с л у ч а й н ы й м е х а н и з м

о п т и м а л ь н о г о р а с п р е д е -

і

.

'

л е н и я ч а с т о т р е а г е н т н ы х

р е ж и м о в ; 3 — к о м а н д н о е

I

If.

 

1 J

 

I

у с т р о й с т в о ; 4 — р е г у л я т о р ы п о д а ч и р е а г е н т о в

I

 

I

1

 

I

Решение игры при известной смещенной стратегии природы.

Практически весьма важным случаем является тот, когда известно априорное распределение F(X) стратегий природы. Действительно, наличие в системе управления обогатительной фабрики развитой системы контроля и достаточно мощного вычислителя позволяет заблаговременно рассчитать применяемую смешанную стратегию F (X) природы.

Задача оптимизации, как и в предыдущем случае, состоит в мак­ симизации функции E(G, F ) , определяемой по уравнению (III.219) выбором оптимальной смешанной стратегии.

Для получения алгоритма решения игры при известной страте­ гии F (X) удобно пользоваться введением функции

 

 

J (Y)

JK(X,

Y)dF(X).

(111.220)

Тогда, учитывая

равенства

(III.220) и (III.214), можно записать

 

 

E(Q,

F)=

\j(Y)dQ{Y).

(III.221)

Функция

J(Y) непрерывна

на

замкнутом

параллелепипеде Sm

и достигает

своего

наибольшего

значения

в некоторой точке

Y = Y0:

 

 

 

 

 

 

 

 

max J (Y)=J (Y0)=a.

(III.222)

191

Таким образом, для равенства (III.222) имеет оценку

 

 

Е ( 0

, F )

=

j / ( Г ) й Ю ( К ) < | а ^ О ( К ) =

а,

(III.223)

так как по определению J" dG (У) = 1.

 

 

 

 

 

Кроме того,

 

 

 

 

 

 

 

 

 

 

E(JyDF)=$J(Y)dIy=J(Y0)

 

= «,

 

(ПІ.224)

где

/ у 0 — одноступенчатая

функция

распределения

со

скачком,

равным

единице, в точке У = Уо.

 

 

 

 

 

Сравнивая равенства

(III.223) и (III.224),

видим,

что

функция

E(G,

F)

максимизируется

при G ( F ) = / y 0 и

имеет место

соотно­

шение

 

 

 

 

 

 

 

 

 

a = m a x £ ( G ,

F)=E(IY<1,

 

F ) = m a x

[К(Х,

Y)dF(X).

 

(III.225)

 

 

о (Г)

 

 

y £ s

m J

 

 

 

Таким образом, решением игры будет стратегия У = Уо (чистая стратегия из всех возможных стратегий параллелепипеда Sm), применение которой дает игроку Y минимальный выигрыш, равный

maxE(G,

F).

 

 

 

 

 

 

 

 

G(Y)

 

 

 

 

 

 

 

 

 

Рассмотрим решение

игры

с

заданной

платежной

функцией

(III.218).

 

 

 

 

 

 

 

 

Подстановкой

формулы (III.218) в

формулу

(III.220)

получим

 

 

 

я

 

j Pt

 

 

 

 

 

J

(У)=

2 Qr

(У)

(X) dF(X).

 

(III.226)

Интегралы

 

 

 

 

 

 

 

 

 

 

b=\pT(X)dF(X);

 

r=\7~R

 

(Ш.227)

легко

вычисляются через моменты функции

распределения F(X).

В результате получаем J(Y)

в виде некоторого

полинома

 

 

•/00=2 Qr (>0rV

 

 

(1П-228)

Находя максимум функции /(У), получаем единственную опти­ мальную (чистую) стратегию У0==(г/°1> у°, ..., у°т), т. е. единст­ венный оптимальный реагентный режим. Отсюда ясно, что построение системы управления технологическим контуром в такой ситуации вообще теряет смысл, и при условии неизменности техно­ логических характеристик оборудования на длительных интервалах

192

Соседние файлы в папке книги из ГПНТБ