Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладной системный анализ / ПСА-Балаганский.doc
Скачиваний:
136
Добавлен:
27.03.2015
Размер:
2.67 Mб
Скачать
    1. Выбор в условиях неопределенности

До сих пор мы обсуждали подходы к описанию и осуществлению выбора в таких условиях, когда последствия сделанного выбора были определены однозначно. Выбор одной из альтернатив хХбыл связан с известным выбирающему однозначным следствием, и вся проблема выбора – это проблема сравнения разных следствий.

Задание неопределенности с помощью матрицы.В реальной практике нередко приходится иметь дело с более сложной ситуацией, когда выбор альтернативы неоднозначно определяет последствия сделанного выбора: имеется набор возможных исходовyY, из которых один окажется совмещенным с выбранной альтернативой, но какой именно – в момент выбора неизвестно, а станет известно позже, когда выбор уже сделан и изменить ничего нельзя. Хотя с каждой альтернативой х связано одно и то же множество исходовY, для разных альтернатив одинаковые исходы имеют разное значение. В случае дискретного набора альтернатив и исходов такую ситуацию можно изобразить с помощью следующей матрицы.

xi\yj

y1

y2

...

...

yj

...

...

...

ym

x1

q11

q12

...

...

q1j

...

...

...

q1m

x2

q21

q22

...

...

q2j

...

...

...

q2m

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

xi

qi1

qi2

...

...

qij

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

xn

qn1

qn2

...

...

qnj

...

...

...

qnm

В этой матрице все возможные подходы образуют вектор y=(y1,...,ym), числаqijвыражают оценку ситуации, когда сделан выбор альтернативыxi и реализовался исходyj.В разных случаях числаqij могут иметь различный смысл: иногда это «выигрыш», иногда «потери», «платежи» и т.д. Если все строкиqi=(qi1,...,qim)при любыхiодинаковы, то проблемы выбора между альтернативами нет. Если же строки матрицы различны, то возникает вопрос, какую альтернативу предпочесть, не зная заранее, какой из исходов реализуется? Аналогично, в случае непрерывных множествXиYситуация описывается с помощью задаваемой на этих множествах функцииq(x,y), xX, yYс соответствующей постановкой задачи о выбореx.

Сказанного пока недостаточно для формальной постановки задачи выбора. При различной конкретизации эта задача приобретает различный смысл и требует различных методов решения. Математический аппарат решения таких задач называется теорией игр. Стороны называют «игроками», альтернативы – «ходами», правила выбора – «стратегиями», величины qij– «выигрышами».

Один класс задач называется «играми с природой». Считается, что исходы Y=(y1,...,ym)– есть возможные «состояния природы». Желательность каждой альтернативыxi зависит от состояния природы, но узнать каково оно, мы можем лишь после того, как сделаем выбор.

В другом классе задач предполагается, что исходы Y=(y1,...,ym)– это множество альтернатив, на котором выбор осуществляет второй игрок, который в отличие от беспристрастной природы преследует свои интересы, отличные от интересов первого игрока. При этом матрицаQ=||qij||, характеризующая оценки ситуаций с токи зрения первого игрока, выбирающего xiуже недостаточна для описания всей игры. Необходимо задать вторую матрицуU=||uij||,описывающую игру с позиций второго игрока. ЗаданиеX,Y,Q,Uназывается нормальной формой игры. Расхождения между матрицамиQиUопределяют степень антагонизма игроков.

Если qij+uij=const для всехiиj, то соперничество называется строгим. В случае, еслиqij+uij=0 – имеем игру с нулевой суммой. Существуют игры с нарастающей конфликтностью.

Критерии сравнивания альтернатив при неопределенности исходов (игры с природой).Очень кратко рассмотрим основные идеи и подходы к решению задач теории игр. Центральным моментом является введение критерия для оценки выбираемого варианта. Нужно дать оценку сразу всей строке платежной матрицы, затем сравнивая их можно сделать выбор.

Максиминный критерий Вальда. Самым распространенным является критерий выбора «наименьшего из зол», называемый максиминным критерием Вальда. В каждой из строк матрицы платежей находится наименьший выигрыш

который характеризует гарантированный выигрыш в самом худшем случае и считается оценкой альтернативы xi. Остается найти альтернативу x*, обеспечивающую наибольшее значение этой оценки

Эта альтернатива называется оптимальной по максиминному критерию.

Часто платежную матрицу определяют не через выигрыш, а через проигрыш, тогда тот же принцип приводит к минимаксному критерию. Критерий Вальда является крайне осторожным, очень пессимистичным, поэтому были предложены другие критерии.

Критерий минимаксного риска (критерий Сэвиджа).По платежной матрице Q вычисляется «матрица риска» S

Критерий пессимизма – оптимизма Гурвица. Дальнейшее ослабление пессимистичности оценок альтернатив дает критерий пессимизма – оптимизма (критерий Гурвица), который сводится к взвешенной комбинации наилучшего и наихудшего исходов. За оценку альтернативы xiпринимается величина

0a1

Проиллюстрируем применение описанных критериев на элементарном примере игры с природой 4x3, матрица выигрышей дана в таблице.

Аij

П1

П2

П3

А1

20

30

15

А2

75

20

35

А3

25

80

25

А4

85

5

45

Рассмотрим критерии Вальда, Сэвиджа и Гурвица (a=0,6 перевес в пользу пессимизма).

  1. Критерий Вальда: подсчитаем минимумы по строкам и выберем ту стратегию, для которой минимум строки максимален – это стратегия А3(25).

  2. Критерий Сэвиджа: перейдем от матрицы выигрышей к матрице риска S

Аij

П1

П2

П3

max Si

А1

65

50

30

65

А2

10

60

10

60

А3

60

0

20

60

А4

0

75

0

75

Из чисел правого столбца минимальный риск (60) соответствует строкам А2и А3. Значит обе эти строки оптимальны по Сэвиджу.

3. Критерий Гурвица: перепишем таблицу, при этом в трех дополнительных столбцах поставим минимум строки i, максимум строкиiи gi=ai+(1-a)i

Аij

П1

П2

П3

i

i

gi

А1

20

30

15

15

30

21

А2

75

20

35

20

75

42

А3

25

80

25

25

80

47

А4

85

5

45

5

85

37

Максимальное значение gi= 47 соответствует стратегии А3.

В данном случае все три критерия говорят в пользу стратегии А3.

Общее представление о теории игр со строгим соперничеством.Некоторые особенности игровых ситуаций хорошо видны на простейшем примере. Пусть имеется игра с континуальными множествами X и Y, строгим соперничеством сторон и нулевой суммой. Это делает достаточным рассмотрение лишь одной функции платежей q(x,y), которую один игрок старается максимизировать по x, а другой минимизировать по y. В тех случаях, когда

точка (x*,y*), в которой достигается это равенство, одновременно удовлетворяет амбиции обоих игроков. Эта точка равновесия интересов сторон называется седловой. Она и является решением игры.

Однако, существуют игры без седловой точки. В такой ситуации становится выгодно скрывать от противника свой выбор и даже свой способ выбора. Это достигается введением смешанной стратегии, которая состоит в том, что задаются лишь вероятности выбора альтернатив, а сам выбор осуществляется случайным механизмом, подчиняющимся заданному распределению.

В соответствии с теоремой фон Неймана любые игры со строгим соперничеством имеют решение в смешанных стратегиях.

Пример решения простейшей игры в чистых стратегиях. Игра задана матрицей.

Ai\Bj

B1

B2

B3

B4

i

A1

2

4

7

5

2

A2

7

6

8

7

6

A3

5

3

4

1

1

j

7

6

8

7

Выписываются минимальные значения в каждой строке iи максимальные значения в каждом столбцеj (выделены жирным шрифтом). Если максимальный из минимумов по строками равен минимальному из максимумов по столбцам, то такая точка называется седловой. Стратегии, соответствующие седловой точке и будут являться решением игры. В нашем случае седловая точка соответствует паре стратегий A2и B2.

Соседние файлы в папке Прикладной системный анализ