Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория игр.doc
Скачиваний:
82
Добавлен:
03.06.2015
Размер:
11.32 Mб
Скачать

1.Теория принятия решений

1.1Лотерея

Введем следующие обозначения.

X– множество призов,

- множество возможных состояний мира,

X,- конечные множества.

Лотереейназывается любая функцияf, которая любому иставит в соответствие неотрицательное числотакое, что.

L– множество таких лотерей, т.е.L=,

.

Обозначим

.

Информация лица, принимающего решение (ЛПР), о действительном состоянии мира может быть описана событием ,.

Обозначим .

Пусть лицо, принимающее решение, считает, что настоящее состояние мира находится среди элементов множества S. Пусть для него при этом лотереяfне хуже, чем лотереяg. Этот факт запишем как

.

Лотерея fэквивалентна лотерееg

тогда и только тогда, когда и.

fлучшеg

тогда и только тогда, когда и.

Обозначения

, >, ~

будем употреблять вместо, соответственно, , , .

, , иg, , определим лотерею

следующим образом:

= .

Интерпретация следующая. Пусть в урне находятся белые и черные шары в пропорции, соответственно, и. Лицо, принимающее решение (ЛПР), вытаскивает из урны шар. Если он белый, то ЛПР играет в лотереюf, если шар черный, то в лотереюg.

Обозначим через такую лотерею, что [x] (y|t) = 1, еслиy=x

[x] (y|t) = 0, еслиyx.

Таким образом, лотерея позволяет выиграть призxс вероятностьюи призyс вероятностью.

1.2.Аксиомы

Они формулируются для любых лотерей e,f,gиhизL, любых событийSиTиз, любых,,,(бывает, что).

Аксиома 1А (полнота)

или

Аксиома 1Б (транзитивность)

Если и, тогда.

Аксиома 2(уместность)

, тогда.

Аксиома 3(монотонность)

Если и, тогда.

Аксиома 4(непрерывность)

Если и, тогда:.

Аксиома 5А (объективная подстановка)

Еслиии, тогда

Аксиома 5Б(строгая объективная подстановка)

Если ии, тогда

Аксиома 6А(субъективная подстановка)

Если ии , тогда

Аксиома 6Б(строгая субъективная подстановка)

Если ии , тогда

Пример:

Пусть ЛПР считает, что [x]>[y], но 0.5[y]+0.5[z]>0.5[x]+0.5[z].

Нарушена аксиома 5Б.

Пусть [w] такое, что

0.5[y]+0.5[z]>[w]>0.5[x]+0.5[z], т.е. [x]>[y], но

0.5[y]+0.5[z]>[w]>0.5[x]+0.5[z].

Рассмотрим такую ситуацию:

Три стратегии у ЛПР:

  1. выбрать [w];

  2. отказаться от [w], подбросить монету, выбратьz, если выпал Орел и выбрать [x], если при подбрасывании монеты выпала Решка;

  3. отказаться от [w], подбросить монету, выбратьz, если выпал Орел и выбрать [y], если выпала Решка.

По первой стратегии ЛПР получит [w].

По второй стратегии ЛПР получит 0.5[x]+0.5[z].

По третьей стратегии ЛПР получит 0.5[y]+0.5[z].

Т.к. 0.5[x]+0.5[z]<[w]< 0.5[y]+0.5[z],

то он должен следовать третьей стратегии, т.е. отказаться от [w]. Но если выпадет Решка (при отказе от [w]), то он должен выбрать [x], т.к. [x]>[y].

Т.е., отказываясь от [w], он в действительности получает 0.5[x]+0.5[z], что хуже, чем [w]. Значит он должен выбрать [w], что противоречит первому заключению об отказе от [w].

Аксиома 7(интереса)

,такие, что.

Аксиома 8(нейтральности по состояниям)

Для любых ,, еслиии, тогда.

1.3.Теорема о максимизации ожидаемой полезности

Функцией условной вероятностинаназывается любая функциятакая, чтои для любого события,, если.

Обозначим ,,.

Функция полезности может быть любая функция из .

Функция полезности называется независимой от состояния тогда и только тогда, когдатакая, чтоu(x,t) =u(x) x, t.

Для p,u, лотереиfи событияопределимфункцию ожидаемой полезности

.

Теорема 1.3.

Аксиомы 1-7 выполняются тогда и только тогда, когда существует функция полезности и функция условной вероятноститакие, что

1) и;

2) R,S,Tтаких, чтои;

3) тогда и только тогда, когда,.

Обозначим

,и.

, если,

, если.

, если,

, если.

Определим функцию полезности и функцию условной вероятности, для которых справедлива теорема. Если t–действительное состояние мира, то пустьu(x,t) равно такому, что

, т.е.

.

Если действительное состояние мира находится во множестве S, то пусть p(t|S) равно такому

, что

, т.е.

.

Доказательство теоремы.

Сначала выведем условие 3.

Аксиома уместности гарантирует, что .

Аксиома субъективной подстановки гарантирует .

Из аксиомы объективной подстановки следует, что тогда и только тогда, когда

,

гдеобозначает число состояний в.

.

Повторяя применение аксиом объективной подстановки, получаем:

==.

Аналогично:

По транзитивности тогда и только тогда, когда

.

По аксиоме монотонности эти отношения выполняются тогда и только тогда, когда

,

т.к. аксиомы присутствия интереса и точной субъективной подстановки гарантируют, что .

Таким образом, условие 3 доказано.

Выводим условие 2 из аксиом:

=по аксиоме объективной подстановки.

Здесь |R| - число состояний во множествеR.

Из аксиом 5А и 5Б: .

Из аксиомы уместности и. Отсюдаp(r|S)=0 прииp(S|S)=1.

Т.е. действительно pявляется функцией условной вероятности, как определено выше.

Предположим, что и используямы имеем

.

Более того, так как ,ивсе дают один и тот же, наихудший, выигрыш внеS, аксиома уместности гарантирует, что

, ().

По аксиомам субъективной и объективной подстановки

=.

Но .

Также , так что из монотонности следует, что.

Таким образом, доказано, что условие 2 следует из аксиом.

Покажем, что существование функций uиp, удовлетворяющих условиям 1-3 достаточно, чтобы все аксиомы 1-7 выполнялись.

Как, например, выводится аксиома субъективной подстановки.

Пусть ии

По условию 3 .

Но формула Байеса (условие 2) означает, что ====

.

.

Таким образом, и.

Следствие

Все аксиомы 1-8 выполняются тогда и только тогда, когда условия 1-3 выполняются с функцией полезности, независимой от состояния.

Если [y] – наилучшая лотерея, а [z] – худшая при состоянииt, тогдаu(y,t)=1 иu(z,t)=0, т.к.и. Это следует из аксиомы монотонности.