Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTVET_tigr-1.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
9.13 Mб
Скачать

17. Доказательство основной теоремы теории игр Дж. Фон Неймана.

Или основная теорема матричных игр Дж. фон Неймана: любая матричная игра имеет решение в смешанных стратегиях, т.е. существует цена игры в смешанных стратегиях V и оптимальные смешанные стратегии Рои Qo соответственно игроков А и В.

18. Доказательство критерия оптимальных смешанных стратегий в терминах данной цены игры, выигрыш-функции и множеств смешанных стратегий игроков.

Т. Пусть V – цена игры, H(P, Q) – ф-ия выигрыша, SAи SB – мн-ва смеш.стр-ий соответственно иг-овА и В.

1. Для того чтобы стр.P0иг-ка А была опт.⇔чтобы выполнялось нерав-воH(P0, Q) ≥ VQSB, (1) т.е. выбор игроком Аопт.стр-ииP0 гарантирует ему выигрыш H(P0, Q), не меньший цены игры V, при любой стр-ииQиг-каВ.

2. Для того чтобы стр.Q0иг-каВ была опт.⇔чтобы выполнялось нерав-воH(P, Q0) ≤ VPSA,(2) т.е. выбор игроком В одной из своихопт. стр-ийQ0 гарантирует ему проигрыш, не больший цены игры V, при любой стр-ииPиг-каА.

Док-во.Докажем утв. 1.

Необх-ть. Пусть P0 – опт.стр.иг-каА. Тогда по основной Т матричных игр фон Неймана пок-льэфф-тиα(P0) стр-ииP0 равен цене игры VV = α(P0). (3)

Рассматривая α(P0) как пок-льэфф-тиα(P0, SB) стр-ииP0 относ. мн-ваSBсмеш.стр-ийиг-каВ, будет иметь по опр. Из рав-тв (3) и (4) получаем нерав-во (1) и Необх-ть доказана.

Дост-ть. Пусть для некоторой стр-ииP0 иг-каА выполняется нерав-во (1). Для доказательства опт-тистр-ииP0 достаточно показать справедливость рав-ва изТ фон Неймана: α(P0) = V. (5) Т.к. нерав-во (1) выполняется ∀стр-ииQSBиг-каВ, то Но Совокупность (6) и (7) эквивалентна рав-тву (5). Дост-ть доказана.

Итак, утв. 1 доказано.

Докажем утв. 2. Рассуждения аналогичные.

Необх-ть. Пусть Q0 является опт. стратегией иг-каВ. Тогда, рассматривая β(Q0) как пок-льβ(Q0, SA) неэфф-тистр-ииQ0 относ. мн-ва SAсмеш.стр-ийиг-каА в силу утв. Т фон Неймана и получим: откуда получаем нерав-во (2).

Дост-ть. Пусть для некоторой стр-ииQ0 иг-каВ справедливо нерав-во (2). Т.к. это нерав-во выполняется ∀стр-ииPSAиг-каА, то оно будет справедливым и для т.е. Но и Из нерав-тв (8) и (9) получаем рав-во которое в силу Т фон Неймана означает, что стр.Q0 является опт.

19. Доказательство критерия оптимальных смешанных стратегий в терминах данной цены игры, выигрыш-функции и множеств чистых стратегий игроков.

Теорема (критерий оптимальных стратегий)

Пусть V-цена игры, Н(P,Q)-выигрыш-функция, SA и SB- множество смешанных стратегий соотв игроков А и В.

  1. Для того чтобы стратегия Р0 игрока А была оптимальной необходимо и достаточно чтобы выполнялось равенство: Н(Р0,Q)>=V для любого Q∈SB то есть выбор игроком А оптимальной стратегии Р0 гарантирует ему выигрыш Н(P0,Q) НЕ МЕНЬШЕЙ ЦЕНЫ ИГРЫ V, при любой стратегии Q игрока В.

  2. Для того чтобы стратегия Q0 игрока В была оптимальной, необходимо и достаточно, чтобы выполнялось неравенство: Н(Р,Q0)<=V для любого Р ∈SA т.е. выбор игроком В оптимальной стратегии Q0 гарантирует ему проигрыш Н(Р,Q0), не больший цены игры V при любой стратегии Р игрока А.

Теорема остается справедливой если в ее формулировке множ смещанных стратегий SA и SBзаменить соответственно на множ чистых стратегий SCA ИSCB

Доказательство

  1. Необходимость. Пусть P0 –оптимальная стратегия игрока А. тогда по теореме фон неймана показатель эффективности α(P0) стратегии P0 равен цене игры V.

V=α(P0)

Рассматривая α(P0)как показатель эффективности α(P0, SB)стратегии Р0 относительно множества SBсмешанных стратегий игрока В, будем иметь по определению

α(P0)= α(P0, SB)=minH(P0,Q) при Q∈SB чтд

Достаточность. Пусть для некоторой стратегии P0 игрока А выполняется неравенство (Р0,Q)<=V для любого Р∈SA. Для токазательства достаточно показать справедливость равенства α(P0)=V

Так как неравенство выполняется для любой стратегии Q∈SB игрока В, то

α(P0)= α(P0, SB)=minH(P0,Q)>=V

но цена игры V равна нижней цене игры, по определению которой

V=V_=maxα(P)>= α(Р0). Достаточность доказана

Чтд.

  1. Необходимость. Пусть Q0 –оптимальная стратегия игрока В. Тогда, рассматривая β(Q0) как показатель β(Q0,SA) неэффективности стратегии Q0 относительно множества SA смешанных стратегий игрока А будем иметь:

V= β(Q0)= β(Q0,SA)=maxH(P,Q0), откуда получаем Н(Р0,Q)<=V для любого Р ∈SA

Достаточность.

Пусть для некоторой стратегии Q0 игрока В справедливо неравенство Н(Р0,Q)<=V для любого Р ∈SA, а значит и для maxH(P,Q0), то есть β(Q0) )= β(Q0,SA)= maxH(P,Q0)<=V. НО V=V(верхняя граница)=min β(Q)<= β(Q0)

Из неравенст получаем равенство V= β(Q0) которое означает что стратегия является оптимальной.чтд

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]