книги из ГПНТБ / Клемин А.И. Инженерные вероятностные расчеты при проектировании ядерных реакторов
.pdfСредняя функция риска минимальна, когда подынтегральная функ ция не отрицательна. Иными словами, в критическую область Glt где бракуется гипотеза Я 0 , следует отнести все выборки, для кото рых
|
L |
(xi, |
х%,.. |
•, xn/S{) |
^ П1 0 —П0 0 |
_ Ро __ с |
|
(13 8) |
||||
|
L |
(Хі, |
хг |
|
xn/S0) |
П0 і—П1 Х |
рх |
|
|
|||
Отношение, стоящее в левой части неравенства, называется |
отноше |
|||||||||||
нием правдоподобия. |
Это |
есть частное |
от |
деления |
вероятностей |
|||||||
получить данную выборку (xlt |
х2, |
хп) |
в случае 5 = |
Sx и 5 = 5 0 |
||||||||
соответственно. |
|
|
|
|
|
|
|
|
|
|
|
|
Итак, бейесовское правило выбора одного из двух взаимоисклю |
||||||||||||
чающих |
решений у0 |
и ух состоит в следующем. Если на опыте полу |
||||||||||
чена выборка xlt |
х2, |
|
хп; |
для которой отношение правдоподобия |
||||||||
(13.8) не меньше с, то выбирается решение уг |
о справедливости гипо |
|||||||||||
тезы #х (гипотеза |
# 0 |
отвергается) и наоборот. Так что область при |
||||||||||
емки гипотезы Н0 |
G0 |
= |
(— оо, с), а критическая область Gx = (с, оо). |
|||||||||
Правило выбора по максимуму апостериорной вероятности. Это |
||||||||||||
правило |
выбора |
решения |
является |
частным случаем |
бейесов- |
|||||||
ского, когда потери (см. табл. |
13.1) |
Цю == П 0 ь П 0 0 = |
П п . |
Таким |
||||||||
образом, процедура выбора решения остается прежней [см. соот
ношение (13.8)], изменяется лишь порог с: |
|
|
с = p0/Pl |
= pol{\ — ро). |
(13.9) |
Используя формулу Бейеса |
(1.10), легко показать, |
что такой спо |
соб выбора отвечает максимуму апостериорной вероятности состоя
ния 5 Ь |
т. е. вероятности |
состояния |
после измерений |
величины |
X: |
X\i |
ХП. |
|
|
|
|
Правило выбора по максимуму правдоподобия. Можно условить |
|||||
ся считать гипотезу Нх |
справедливой (т. е. принять |
решение |
ух |
||
о том, что имеет место состояние SJ, |
если функция правдоподобия |
||||
выборки |
(13.7) |
|
|
|
|
|
L (xlt X.,, |
xJSJ > L |
(хх, х2, .... xJSQ). |
• (13.10) |
|
Такое правило выбора решения также является частным случаем
общего бейесовского правила |
(13.8) при равных потерях Пю = |
П 0 1 , |
||||||
П0 о = П Ц |
И вероятностях |
состояний ро = Pi = 0,5. |
В этом |
слу |
||||
чае |
порог |
с = 1. |
|
|
|
|
|
|
|
Минимаксное правило. Оно также является частным случаем |
|||||||
бейесовского (13.8) и используется при неизвестных |
априорных |
|||||||
вероятностях состояний ро и Pi = |
1 — р 0 . При этом в качестве ве |
|||||||
роятностей |
ро и Pi в соотношении |
(13.8) подставляют так называе |
||||||
мые минимаксные значения |
р*™, |
рм х м = 1 — р м 0 м . |
Вычисление ве |
|||||
личины |
рм 0 |
м достаточно трудоемко [115, 116]. Поэтому, когда нет |
||||||
никакой |
информации относительно величин р 0 и р ъ |
более разумно |
||||||
использовать бейесовское правило (13.8), положив в нем р 0 = P |
l = |
|||||||
= |
0,5. |
|
|
|
|
|
|
|
9 Зак: 1282 |
241 |
Таким образом, процедура выбора решения по всем рассмотрен ным правилам единообразна и заключается в сравнении отношения правдоподобия (13.8) с порогом с, соответствующим применяемому правилу.
Выбор на основе последовательного анализа. Рассмотренные пра вила применяются для выборок л*!, х2, ... , хп определенного объема п. Если каждое измерение xt связано со значительными трудностя ми, то решение целесообразно выбирать с помощью методов после довательного анализа (анализа Вальда, [117]), позволяющего мини
мизировать среднее значение объема п |
выборки |
(но, правда, не |
учитывающего потерь при ошибочных |
решениях). |
|
В этом случае пространство выборок |
делится |
на три области: |
G0 , Gx и промежуточную область Gn p0 M- Если выборка объемом п = 1 (одно измерение) попадет в область G0 , то гипотеза Я 0 принимается; она отвергается при попадании выборки в область Gx. Если же вы борка попадает в область G n p o M , то наблюдения должны быть про должены, т. е. необходимо произвести второе измерение и провер ку начать заново. Используя такое правило выбора решения, будем всякий раз проводить минимум измерений (опытов) п по сравнению с другими методами выбора решения.
Когда вероятности ошибок первого и второго рода р\ и р 2 не превышают 0,5, что, как правило, всегда выполняется в практиче
ских задачах, рассматриваемое правило выбора |
состоит в |
сравнении |
|||||||||
отношения |
правдоподобия |
с двумя |
порогами [116, 117]. Если при |
||||||||
п-и |
измерении |
(п ^ |
2) |
выполняются неравенства |
|
|
|||||
|
|
|
Рз |
^- |
L (хх, Х2, . . . , |
Xji/Sj) |
1 —Рг |
/то |
i i \ |
||
|
|
|
1—Рх |
|
L(xl,x2,...,xh/S0)l |
|
|
р |
|
|
|
где |
k = 1, |
2, |
.... п — |
1, |
|
|
|
|
|
|
|
|
|
|
L |
(jti, |
х2, |
• • • , xn/S{) |
. Рз |
^ |
j |
(13 |
12) |
|
|
|
L |
(*!, |
х2, |
. . . , xn/S0) |
1—PJ |
|
|
|
|
то принимается решение Y0 (при п = 1 достаточно выполнения одного второго неравенства). Решение ух принимается, если выполняется неравенство (13.11) и неравенство:
L (xi, х2, |
. . •', xnIS-i) |
^ 1-—Рг^ j |
(13 13) |
L(xltx2, |
..:,xnlS0) |
[Pi |
|
Пример проверки простой гипотезы против простой альтернати вы. Для выяснения возможности форсирования мощности каналь ного реактора с кипящей водой в качестве теплоносителя был прове ден эксперимент по определению критической плотности теплового потока д к р в наиболее напряженном канале активной зоны. В ре зультате п повторных опытов (при одних и тех же режимных пара метрах канала) получена выборка значений qKp
(13.14)
Предварительные |
расчеты показали, что если истинное |
значение |
|||||
(математическое ожидание) qKp |
для |
канала |
равно |
q° |
т о ф 0 р |
||
сировать мощность |
реактора можно |
(гипотеза Я 0 , |
состояние |
S0, |
|||
решение у0). Если |
же это значение |
равно |
q}ip < ; |
|
то подни |
||
мать мощность нельзя (гипотеза |
Ht, |
состояние St , |
решение |
у{). |
|||
Требуется на основе экспериментальных данных (13.14) выбрать
одно |
из двух |
решений. |
|
|
|
|
|
|
||
Предположим, что средняя квадратическая погрешность опытных |
||||||||||
данны-х (13.14) известна и равна а. Закон распределения |
резуль |
|||||||||
татов |
эксперимента |
/ (q1{p) |
можно |
считать |
|
нормальным. |
Тогда, |
|||
подставляя |
в |
неравенство • (13.8) функцию |
|
правдоподобия |
(13.7), |
|||||
где f(xt/Sj) |
= |
f (qKpi/Sj), |
несложно |
получить |
|
|
||||
|
|
L |
(?крі> ?кр2, • • • • ?крп/^і) |
|
|
|
|
|||
|
|
L |
(Якрі< |
?кр2> • • • і |
ЯкрпІ^о) - ' » П |
|
/ (?Kpi/so) |
|
||
|
|
|
|
|
|
|
1= 1 |
|
|
|
|
|
|
ехр |
(?крі — ? к р ) 2 |
~| |
|
|
|
||
|
|
|
|
2а2 |
?кр—?кр |
|
||||
|
|
|
ІП |
|
|
|
||||
|
|
|
|
|
|
0 |
|
1кр і |
|
|
|
|
|
|
_ |
ІЯкрі— ?кр)2 |
а |
|
|||
|
1=11 |
|
|
|
||||||
|
ехр |
|
2а2 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
n\{qlPf-(qlPf] |
> І П С. |
||
2а |
2 |
||
|
|||
Отсюда правило выбора решения следующее: если выполняется не равенство
п |
2 |
* |
n ( ^ P - ^ p ) |
' |
j = 1 |
|
|
|
|
то принимается решение yt, |
если |
не |
выполняется |
у0 . Величина |
с рассчитывается в соответствии с принятым правилом выбора ре шения.
§ 13.2. Выбор решения на основе проверки сложной гипотезы
В практических задачах часто необходимо проверить |
гипотезу |
|
о том, что некоторый параметр х объекта лежит в заданной |
области |
|
возможных значений [а, Ь]. В общем случае каждому |
отдельному |
|
значению параметра х соответствует свое состояние |
объекта S. |
|
Следовательно, значениям параметра внутри упомянутой области отвечает уже не одно состояние, как в случае простой гипотезы, а множество — континуум.. Так, если проверяется гипотеза, что па раметр х = х0, против альтернативы х < xQ, то гипотеза будет простой (одно состояние), а альтернатива сложной (континуум сос тояний). Если же проверяется гипотеза Н0, что х ^ х 0 , против
9* |
243 |
альтернативы Ни что х < х0, то и гипотеза, и альтернатива явля ются сложными.
Предположим, что в результате эксперимента получено п зна
чений (замеров) некоторого определяющего параметра |
объекта |
|
при прочих постоянных условиях: |
|
|
л'х, х2, |
хп. |
(13.15) |
Если отсутствуют случайные |
факторы, сопровождающие изме |
|
рения, то вместо выборки (13.15) имеется одно единственное число
М(х). |
Будем говорить, что объект находится |
в состоянии S, если |
||||||||
математическое |
ожидание |
определяющего |
параметра |
объекта |
||||||
М{х) |
= |
S. |
|
|
|
|
|
|
|
|
Допустим, что величина S может попасть в один |
из двух непере |
|||||||||
секающихся интервалов на оси х: |
|
|
|
|
|
|||||
|
|
|
S0 в [а0, Ь0] и S1 |
в [alt bt]* |
|
|
|
|||
и известны априорные вероятности попадания S |
в эти |
интервалы |
||||||||
ро и |
|
Обозначим Но гипотезу о том, что 5 |
находится в нулевом |
|||||||
интервале, a Ht — в первом интервале. Требуется |
сформулировать |
|||||||||
правило, |
которое |
позволит, |
основываясь на данных |
эксперимента |
||||||
(13.15), |
выбрать |
решение |
у0 |
или yi |
относительно |
справедливости |
||||
гипотезы Н0 или |
Ht. |
получить |
(по аналогии с |
рассмотренным |
||||||
Такое правило можно |
||||||||||
выше бейесовским правилом), минимизируя среднюю функцию
риска |
(13.1). |
|
|
|
|
|
|
Бейесовское правило выбора решения теперь формулируется |
|||||||
так: |
принимается |
решение yt (отвергается гипотеза Н0), |
если вы |
||||
полняется условие |
|
|
|
|
|
||
|
|
ГФІ (S)L(XUX2 |
|
xN/S) |
dS |
|
|
|
|
?i |
|
|
> п 1 0 - п 0 0 , _pp_^c ; |
( 1 3 Л 6 ) |
|
|
|
І Фо (S) L (xlt |
x2 |
xn/S)dS |
П 0 1 — П п |
px |
|
решение |
уо принимается |
(справедлива гипотеза Н0), если выпол |
|||||
няется |
противоположное |
неравенство. Здесь |
ср0 (5) и |
cp^S) — |
|||
законы распределения состояний объекта соответственно по интер валам S0 и Sj.
Как видно, при проверке сложной гипотезы с порогом с сравни вается не отношение правдоподобия, а отношение усредненных функций правдоподобия. Запись (13.16) является самой общей фор мой записи бейесовского правила выбора решения. Из нее, напри
мер, |
как частный |
случай |
получается |
неравенство |
(13.8). Пороги |
с для |
бейесовского |
выбора |
решения |
и для выбора |
по критерию |
* |
В о б щ е м с л у ч а е эт и и н т е р в а л ы м о г у т б ы т ь с а м ы м и п р о и з в о л ь н ы м и , н а |
ч и н а я |
о т п о л у б е с к о н е ч н ы х [ — о о , х0] и [х0, оо - j - ] и к о н ч а я в к л ю ч а ю щ и м и в се |
б я в с е г о о д н у т о ч к у [а0] и [at].
апостериорной вероятности в случае сложных гипотез остаются такими же, как и в случае проверки простой гипотезы (13.8) и (13.9).
Правило выбора по критерию максимума правдоподобия теперь формулируется несколько иначе: решение уг принимается, если для выборки (13.15) выполняется неравенство
max L (.Vi, х2 |
xn/S |
£ |
S{) . ^ > с _ j |
(13 17) |
max L (*!, x2 |
xn/S |
£ |
S0) |
|
Пример. В результате замеров фактических значений за грузки урана в отдельный канал активной зоны реактора получен следующий ряд величин xt (в относительных единицах, всего 30 зна чений):
101; |
98; |
102; |
101; 99; |
101; |
102; |
98; |
100; |
|
101; |
102; |
100; |
99; |
102; |
|||||||
101; |
100; |
102; |
98; |
99; |
101; 98; |
102; |
101; 100; |
102; |
|
100; |
99; |
101; |
102; |
|||||||
101. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(13.18) |
|
Замеры проводились на каналах одного типа (одной загрузки), |
||||||||||||||||||||
предназначенных |
для пяти комплектов |
активных зон; общее коли |
||||||||||||||||||
чество каналов |
5000 штук. Выборка |
произведена |
случайным обра |
|||||||||||||||||
зом. Номинальное значение загрузки |
в канал этого типа в соответ |
|||||||||||||||||||
ствии с ТУ на изготовление хя |
= |
100; половина |
|
поля допуска для |
||||||||||||||||
загрузки, |
|
допустим А = |
2. Среднее значение загрузки, |
получен |
||||||||||||||||
ное по |
выборке |
|
(13.18), |
может отличаться |
|
от |
генерального |
сре |
||||||||||||
днего М(х), |
которое получилось бы, если взвесить все 5000 кана |
|||||||||||||||||||
лов. Требуется |
принять |
одно |
из решений |
уг: М(х)^хп, |
|
или |
уй: |
|||||||||||||
. М(х) < хя. |
|
Для |
|
этого |
необходимо |
проверить |
|
соответствующие |
||||||||||||
гипотезы |
(Нх |
и Я 0 ), основываясь на конечной выборке (13.18). |
|
|||||||||||||||||
Если результаты |
этого анализа |
использовать |
непосредственно |
|||||||||||||||||
для практических рекомендаций, то неверное решение вопроса мо жет привести к различного рода потерям, например, одна из ак
тивных зон не отработает свою кампанию |
из-за недостаточного за |
||||||||
паса реактивности |
(который од |
|
|
|
|
|
|
||
нозначно |
связан |
с |
фактической |
|
|
Т а б л и ц а |
13.2 |
||
загрузкой |
урана, |
а она окажет- |
|
П о т е р и , |
отн. ед. |
|
|||
ся меньше ожидаемой). В каче |
|
|
Гипотезы |
|
|||||
стве возможных потерь, связан |
Решения |
|
|
|
|
|
|||
ных с принятием того или иного |
|
|
|
|
я . |
||||
решения, примем приведенные в |
Yo |
|
0 |
|
|
5 |
|||
табл. 13.2. Считаем, что матема |
|
|
|
||||||
|
|
|
|
|
|
||||
тическое ожидание |
(генеральное |
Y i |
100 |
|
|
0 |
|||
среднее значение) |
загрузки М(х) |
|
|
|
|
|
|
||
располагается только в пределах допуска, |
что |
практически |
|||||||
всегда имеет место (см. § 11.2). Однако, |
где именно-расположе |
||||||||
но М(х), |
не известно. Так что для исследователя |
М(х) |
= |
5 — слу |
|||||
чайная величина, |
|
непрерывно распределенная в допусках |
[хя |
— А, |
|||||
А'н + А] по закону |
<p(S). |
|
|
|
|
|
|
||
В нашем случае интервал значений S0 представляет собой от резок [л:н — А, л:п] за исключением точки хю а интервал Sx есть [хв, л:н -f-Д]. Если известен закон ф(5) в интервале [хв — Д,
хн ^ Д], то законы распределения |
cp0(S) и cp^S) отдельно для |
|||
интервалов S0 и 5Х можно |
записать |
|
|
|
|
|
Ф(5) |
при S Е 5 0 ; |
|
|
|
|
|
|
Ф о (S) |
|
Ф (S) dS |
|
|
|
д-—д О |
при 5 6 Si-, |
(13.19) |
|
|
|
|
|
|
|
н + д ( 5 ) |
при S 6 Si; |
|
|
«Pi(S) = |
"\ |
<P(S)dS |
|
|
|
|
О |
при 5 6 50 . |
|
Рассмотрим в рамках данного примера несколько частных слу чаев.
1. М{х) = 5 распределено в пределах допусков Lvn — Д, ха -4- +-Д] по равновероятному закону cp(S) = 1/2Д. По формулам (13.19) находим ф0 (5) = cp^S) = 1/Д, Очевидно, что
р 0 = Р { Л Г ( * ) < х н } = J cp(S)dS = |
|
|||
^ - Д = 0,5; P |
l = l - p 0 = 0 , 5 . |
(13.20) |
||
Для проверки гипотезы Я 1 |
необходимо пороговое |
значение, |
||
согласно формуле (13.16) и табл. |
13.1 и 13.2, |
|
||
100—0 |
20 |
(13.21) |
||
5 - 0 |
||||
|
|
|||
сравнить с отношением усредненных функций правдоподобия (13.16):
j |
cp1(S)L(x1,x2,...,xn/S)dS |
|
л, = |
|
.(13.22) |
J" |
фо (S) L (xlt x 2 , . . . , xn/S) |
dS |
Так как элементы выборки (13.18) независимы и распределены по нормальному закону с параметрами М(х) = S и а, то, согласно выражению (13.7),
L(Xi, х2, ...,xn/S)= |
Y\ |
ехр |
1 / |
Xi-S\2 |
|
|
|||
|
а У 2л |
|
|
|
|
i = l |
|
|
|
гТ/2я ехр |
2 |
|
С^У |
|
1 = 1
Подставляя |
это выражение, а также %(S) = Фх(5) = 1/А в фор |
мулу (13.22) |
и учитывая, что |
|
|
|
2 |
|
л (5 |
|
-xf |
|
|
|
|
|
(13.23) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где л и а 2 вычисляются |
по формулам |
(4.6) при п = 30, |
получаем |
|||||||||||
|
|
|
|
|
( S - x ) a |
dS |
|
|
|
|
|
|
||
|
|
|
|
|
2 а 2 |
|
|
|
|
|
|
|
|
|
|
Jit ' |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Є Х |
Р |
|
— ( 5 - х ) 2 |
|
|
|
|
|
|
|
||
|
Д |
|
|
2 а 2 V |
|
|
|
|
|
|
|
|
|
|
|
J - Хд-^Д- Л |
|
- Ф |
/ х н — х |
|
|
|
|
|
|
||||
|
Ф |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(13.24) |
|
|
ф |
|
• Ф |
а/Уп |
|
|
|
|
|
|
|
|||
|
а/у nj |
|
\ |
|
|
|
|
|
|
|
||||
Здесь |
а — генеральное |
среднее |
квадратическое |
отклонение |
за |
|||||||||
грузки для партии 5000 каналов. Его можно |
оценить по формуле |
|||||||||||||
|
|
|
|
|
_ |
і |
3 0 |
|
|
|
|
|
|
|
(4.9). По выборке (13.18) |
находим |
х = |
зб2>,- |
=100,43; |
а « |
1,38. |
||||||||
Тогда, |
подставляя х н = |
100 и |
А = 2, |
получаем |
(см. табл. П.1) |
|||||||||
|
Ф ( 6 , 2 ) - Ф ( - 1 , 7 1 ) |
0,5 + 0,456 |
|
22. |
(13.25) |
|||||||||
|
Я-1 |
|
|
|
|
|
|
|
|
|
||||
|
Ф ( — 1 , 7 1 ) — Ф ( — 9 , 6 ) |
|
0 , 5 — 0 , 4 5 6 |
|
|
|
|
|
||||||
Следовательно, я х > с = |
20, т. е. гипотеза |
Я х |
(Л1(х) >• хн ) прини |
|||||||||||
мается. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Рассмотрим второй случай, который часто встречается на |
||||||||||||||
практике: М(х) с большей вероятностью |
оказывается |
меньше |
но |
|||||||||||
минального значения. Это будет, например, если М(х) |
= |
S распре |
||||||||||||
делено в пределах допуска по закону |
|
|
|
|
|
|
|
|
|
|||||
|
|
0 |
|
при x n + A < S < x H |
—А; |
|
|
|||||||
|
* „ • + Д — S |
при х „ — A < S < x H |
+ A |
(13.26) |
||||||||||
|
Ф ( 5 ) = |
2 Д 2 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(плотность вероятности линейно |
падает |
от |
ср = |
1/А в точке |
5 = |
|||||||||
= х н — А до 0 в точке 5 = х н + |
А). По формулам |
(13.20) находим |
||||||||||||
/70 = J cp(S)dS= $ xn + A-S
d s _ ±
2 Д 2
А-н -Д
Таким обрізом, в этом случае по формуле (13.16)
100 — 0 |
3-4 г п |
с= |
. —— 60. |
5 — 0 |
4 - 1 |
По формулам (13.19) легко получаем
Отсюда по формуле (13.22), используя выражение (13.24), находим
|
Д — 5 ) ехр |
|
|
dS |
|
|
|
|
( х п + Д - 5 ) ех р _ ^ i ( S _ ^ ) 2 dS |
|
|
|
|||
= |
3 " і [ Ф Ы — Ф («з)] ~l/2 . n4 - e - "i / 2 |
— е ~ " 2 / 2 |
= |
48, |
|||
|
" і [ Ф ("2) — Ф (из)] 1 7 2 л |
- | = . е _ " 2 / 2 |
— е ~ " 5 / |
2 |
|
|
|
где |
|
|
|
|
|
|
|
|
= 6,2; |
и3 = |
а/Уп |
|
|
71; |
|
|
|
|
|
|
|
|
|
|
«я = ' к — А — х _ |
— 9,6. |
|
|
|
||
|
аП/п |
|
|
|
|
|
|
Итак, я 2 = 4 8 < с = 60, т. е. гипотеза |
# j отвергается |
и принимает |
|||||
ся гипотеза |
Н0 (М(х) < хп). Обратите |
внимание, |
что такая гипо |
||||
теза принимается в условиях, когда эмпирическое |
х = 100, 4 3 > х н . |
||||||
Без учета потерь (см. табл. 13.2) всегда бы отвергли |
гипотезу #„ . |
||||||
А их учет позволяет выбрать более рациональное |
решение, обеспе |
||||||
чивающее минимальный риск. |
|
|
|
|
|
|
|
В заключение главы заметим, что учет потерь возможен не только при выборе решений (проверки гипотез), но и при оценке параметров (числовых характеристик) случайных величин, т. е. в задачах параметризации (см. § 4.1 и [115, 116]).
Г л а в а 14.
В Ы Б О Р Р Е Ш Е Н И Я В У С Л О В И Я Х Н Е О П Р Е Д Е Л Е Н Н О С Т И ( Э Л Е М Е Н Т Ы Т Е О Р И И И Г Р )
§ 14.1. Постановка игровых задач
Современная математическая теория игр, которая наиболее бур но развивается в последние десятилетия [118], была вызвана к жизни потребностями практики, в первую очередь, таких обла стей, как военное дело и экономика. Теперь она находит примене ние при решении ряда инженерно-технических задач, в частно-
сти |
в таких |
ситуациях, которые могут |
быть |
классифицированы |
как |
«игры с |
природой». |
|
|
|
Игровая |
задача возникает всякий раз, |
когда |
имеет место кон |
фликтная ситуация, в которой интересы одной стороны сталкива ются с интересами другой. При этом обе стороны своими активны ми действиями стремятся достигнуть как можно большего успе ха для себя и свести к минимуму успех противной стороны. Перед каждой стороной или просто «игроком», естественно, встает вопрос: какими должны быть эти действия, т. е. какой должна быть опта-, мальиая стратегия, дающая возможность получить максимальный выигрыш (минимальный проигрыш).
Для того чтобы разработать алгоритм, позволяющий находить оптимальную стратегию, необходимо схематизировать конфликт ную ситуацию. Для получения такой схемы, которая обычно назы вается просто «игрой», можно активные действия одной стороны обозначить Л;, а действия другой (которые часто представляют со бой конкретные состояния неодушевленных объектов, т. е. при
роды) S}: |
Если известны потери |
Ии |
одной |
стороны |
(выигрыши |
|
другой), |
являющиеся |
результатом |
применения всех |
возможных |
||
пар действий той и |
другой стороны, |
можно |
составить уже зна |
|||
комую нам таблицу потерь (табл. 14.1), или платежную матрицу (см. табл. 13.1).
Т а б л и ц а |
14.1 |
|
Потери для игры / и х я |
St |
s, |
л, |
П |
п |
п 2 а |
Аг |
П,і |
||
А пі |
rimi |
|
П,;і2 |
п 1 п
... п2 „
... П/ЛЛ
Задача теории игр — разработка рекомендаций по выбору оп-' тимального и рационального образа действия каждого из против-, ников. При этом предполагается, что матрица игры (см. табл. 14.1) задана. Ее составление целиком и полностью находится в компетен-' ции специалиста, который ставит и решает конкретную игровую задачу.
Игры классифицируются в зависимости от ряда свойств. Так,'
если число действий сторон конечно и соответственно равно |
тип, |
то игра называется конечной размером т Хп. В противном |
случае |
игра бесконечна. Если выигрыш одной стороны всегда равен проиг-'
рышу другой, то говорят, что игра имеет н у л е в у ю |
с у м м у . ' |
Наиболее разработана теория конечных игр двух сторон |
с нулевой' |
суммой, которые, кстати, наиболее распространены в |
техничес-" |
ких приложениях. |
|
Технические игровые задачи имеют одну существенную особен ность. В самых общих чертах она заключается в следующем. Инже неры, имея дело с материальными объектами, стремятся получить от них максимальную отдачу при минимальных расходах. Но ряд процессов в устройствах и механизмах подчинен случайным за конам. Если бы состояние объекта было известно точно, то выбор действия инженера для получения оптимума не представлял бы трудностей. А так как выбирать решение часто приходится в ус ловиях неопределенности (из-за случайности, неполноты данных об истинном состоянии, настоящем или будущем), выбранное дей ствие может быть далеко не лучшим. Таким образом, стремимся
действовать наиболее правильно, |
а результат не всегда получается |
||
оптимальным — неодушевленные |
объекты (природа) как |
бы про |
|
тивятся, мешают получить больший выигрыш |
(меньшие |
потери). |
|
В связи с этим выбор технических решений при |
неопределенности |
||
называется игрой с природой. |
|
|
|
Подобного рода игры имеют нулевую сумму, так как предпола гается, что выигрываем то, что теряет природа, и наоборот. При таком подходе одной стороной является человек, имеющий набор действий At, а противной стороной — природа (объект) с воз можными состояниями Sj. Причем предполагается, что вероятности этих состояний P{Sj) неизвестны.
Пример. В инструкцию для операторов на АЭС должен быть включен пункт о действиях при внезапном падении расхода через один из каналов реактора (канального типа). Для этого, предполо жим, требуется выбрать оптимальное решение в условиях, когда на пульте управления (в период работы реактора на номинальном уровне мощности) прибор показывает, что расход через некоторый
канал |
Gh |
упал больше, |
чем |
на 50% |
относительно |
номинала Gk- |
||||||
|
В данном случае возможными состояниями Sj объекта могут |
|||||||||||
быть |
следующие: |
|
|
|
|
|
|
|
|
|||
515 2 |
— отказ канала первого типа (пережог за период в несколько |
|||||||||||
минут) — мгновенный |
отказ; |
|
менее 1 ч ) — по |
|||||||||
— отказ |
канала второго |
типа (за |
период не |
|||||||||
53 |
степенный |
отказ; |
|
|
|
|
|
|
||||
— отказ |
датчика |
прибора |
(расходомера); |
|
|
|||||||
5 4 |
— отказ |
показывающего |
прибора. |
|
|
|
||||||
|
В свою очередь, действия операторов могут быть, например, |
|||||||||||
такими: |
|
|
|
|
|
|
|
|
|
|
||
Аг |
— проверка показывающего прибора в течение примерно 15 мин, |
|||||||||||
|
при его исправности экстренное снижение мощности реактора |
|||||||||||
А2 |
на 50%; |
|
|
|
|
|
|
|
|
|
||
— постепенное |
снижение |
мощности |
реактора |
на |
50%; |
|||||||
А3—экстренное |
|
снижение |
мощности |
реактора |
на |
50%; |
||||||
Л 4 |
— экстренная |
остановка |
реактора; |
|
|
|
||||||
А5 |
— никакие |
действия |
не |
предпринимаются. |
|
|
||||||
|
Тщательный |
технико-экономический анализ потерь, связанных |
||||||||||
с остановкой реактора |
(в том числе ложной), с экстренным или по- |
|||||||||||
