Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория игр.doc
Скачиваний:
82
Добавлен:
03.06.2015
Размер:
11.32 Mб
Скачать

1.6.Доминирование

Пусть у ЛПР зависит от состояния. Пусть ЛПР может выбрать любое.Xсейчас будет интерпретироваться как множество решений, которое может сделать ЛПР. Пусть его субъективная вероятность состоянияравнаp(t), т.е.. Тогда ЛПР будет выбирать конкретноетолько если

. (1.6.1)

Выпуклость.

Напомним, что

множество векторов выпукло тогда и только тогда, когда для любых двух векторов pиqи,, еслиpиqпринадлежат множеству, то и вектортакже должен принадлежать этому множеству.

Теорема 1.6.1.

Пусть изаданы.

Множество всех таких, чтоyоптимально, является выпуклым.

Доказательство:

Пусть yоптимально для субъективных вероятностейpиq.

Пусть и пусть.

Тогда

==.

То есть yоптимально, если ЛПР считает, что субъективная вероятность равнаr.

Пример:

Пусть ,. Функция полезностиuпоказана на таблице

Решение

8

1

5

3

4

7

Только 2 состояния, поэтому.

оптимально, если

.

оптимально при.

оптимально, если

.

оптимально при.

оптимально, если

.

не оптимально ни при какомтак как оно должно удовлетворять несовместимым неравенствам ().никогда не оптимально для ЛПР.

Такой выбор ЛПР, который никогда не может быть оптимальным, для любой субъективной вероятности, называется сильно доминируемым.

Существует другой способ определения доминируемости .

Пусть ЛПР бросает монетку и выбирает , если орёл и, если решка. Обозначим эту стратегию.

Если настоящее состояние было бы , то эта смещенная стратегия давала бы ЛПР ожидаемую плату по данной функции полезности, что лучше, чем ЛПР получит, выбрав(плата в этом случае 5).

Если настоящее состояние было , тогда ожидаемая плата, что лучше, чем плата 3, которую ЛПР получил бы, выбрав.

Можем сказать, что сильно доминируется смешанной стратегией. Смешанной стратегией является любое распределение вероятностей на множестве выборов решенийX. Обозначим такую смешанную стратегию .

Определение: для данной функции полезности, выбор решениястрогодоминируем, если

(1.6.2)

Термин строгой доминируемости определён в двух разных смыслах. Эти определения эквивалентны.

Теорема 1.6.2.

Пусть заданы , гдеXи непустые конечные множества и. Смешанная стратегиятакая, чтоyстрого доминируетсяв смысле условия (1.6.2) существует тогда и только тогда, когда не существует какого-либо вероятностного распределения, такого, чтоyоптимально в смысле условия (1.6.1).

Определение:

Выбор решения слабо доминируемсмешанной стратегиейтогда и только тогда, когда, и существует по крайней мере одно состояниетакое, что.

Пример:

Пусть ,ипоказано на таблице

Решение

5

3

5

1

слабо доминируется(т.е. смешанной стратегией, которая с вероятностью 1 выбирает).

оптимально, если ЛПР верит, что-- действительное состояние мира с вероятностью 1, но если допускается любая положительная вероятность для, тогдане оптимально.

Теорема 1.6.3.

Пусть заданы , гдеXинепустые конечные множества и. Смешанная стратегиятакая, чтоyслабо доминируется этой стратегией, существует тогда и только тогда, когда не существует никакого вероятностного распределениятакого, чтоyоптимально в смысле условия (1.6.1).

(Напомним: -- это множество распределений вероятности на, приписывающих положительную вероятность любому состоянию из).

Теоремы 6, 7 доказываются с помощью теорем двойственности из линейного программирования.