Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции!.doc
Скачиваний:
43
Добавлен:
03.12.2018
Размер:
1.82 Mб
Скачать

3.2. Использование смешанной стратегии

Стратегия S* называется смешанной, если она представлена в виде выпуклой комбинации двух других стратегий,

S* = сSm1 + (1 - с)Sm2, 0<с<1, m1, m2  {1, 2, …, t}.

Это определение базируется на понятии выпуклой комбинации точек [14]. Переход к смешанной стратегии осуществляется с целью повышения гарантированной средней полезности.

Стратегии рассмотренного выше примера изобразим точками на плоскости с координатами , , i=1,3,4,7,8 (рис. 2).

П о рис. 2 видно, что если взять в определенных пропорциях стратегии S4 и S8, то получим смешанную стратегию, лучшую по сравнению со стратегией S7. Проведем биссектрису I-го координатного угла и найдем точку пересечения ее с отрезком [S4, S8] –– точку .

Запишем уравнение прямой, проходящей через точки S4(7.6; 4.9), S8 (4;7) ,

,

которое приводится к виду:

.

Из этого уравнения находим координаты точки , для которой ,

.

Так как , то стратегия лучше стратегии S7, гарантирующей 5.2 ед. полезности, S*>S7. Теперь остается представить стратегию в виде выпуклой комбинации стратегий S4, S8,

S* = cS4 + (1 – c)S8, 0 < c <1. (10)

Для определения значения параметра  достаточно записать уравнение (10) для абсцисс входящих в него точек,

из которого получаем . Тогда равенство (10) принимает вид:

. (11)

Так как , , то в силу равенства (11) имеем

.

Практически смешанную стратегию S* можно реализовать так. Если результат эксперимента есть z2 или z3, то используется операция a2. Если же результат эксперимента есть z1, то с помощью подходящего случайного механизма с вероятностью используется операция a1, и с вероятностью –– операция а2. Основой случайного механизма могут служить 19 одинаковых карточек, на 10–и из которых записан символ а1, а на 9–и –– символ а2. Из этого набора 19–и карточек случайно выбирается одна и используется та операция, символ, которой изображен на этой карточке.

3.3. Принятие решений в условиях риска

К условиям, перечисленным в подпараграфе 3.1, добавляется еще одно – значения априорных вероятностей состояний окружающей среды (природы):

p(Q1), p(Q2), ..., p(Qn). (12)

Тогда для каждой стратегии определяется усредненная по всем состояниям природы средняя полезность по формуле:

(13)

U(Si,Qj) – полезность стратегии при состоянии природы , которая находится по формуле (9). Затем из множества , , выделяется максимальный элемент,

, .Стратегия , обладающая максимальной средней полезностью , называется байесовской стратегией,

, .

Пусть в рассмотренном ранее примере р(Q1) = 0.6, p(Q2) = 0.4. Используя данные табл. 9. и формулу (13), вычислим среднюю полезность для каждой допустимой стратегии,

= 100.6 + 00.4 = 6,

= 8.80.6 + 50.4 = 6.68,

= 7.60.6 + 4.90.4 = 6.52,

= 5.20.6 +5.60.4 =5.36,

= 40.6 + 70.4 =5.2 .

Затем найдем наибольшее число из полученных пяти чисел,

Следовательно, оптимальной стратегией является стратегия , обладающая максимальной средней полезностью, равной 6.68 ед.

Заметим, что стратегия является байесовской для конкретных значений априорных вероятностей: р(Q1) = 0.6, p(Q2) = 0.4. При других значениях р(Q1), р(Q2) байесовской может быть и другая стратегия. Так, при р(Q1) = 0.5, p(Q2) = 0.5 байесовской является стратегия .

Проведение эксперимента в рассмотренной ситуации выгодно. Действительно, если эксперимент не проводить, то по данным табл.7 имеем:

Байесовской операцией (стратегией) является операция а1, средняя полезность которой равна 6 ед.

Для дальнейших рассуждений нам понадобиться объединить выражения (13), (9) в одно,

.

Меняя порядок суммирования в правой части последнего равенства, получим

(14)

Из этого равенства следует, что при выборе оптимальной стратегии максимизация сводится к максимизации выражения в квадратных скобках в правой части (14), т.е. для каждого результата эксперимента zβ максимизация полезности Uβ(ai) сводится к выбору такой операции , которая максимизирует выражение в квадратных скобках.

ЛИТЕРАТУРА.

  1. Венцель Е.С. Исследование операций. Задачи, принципы, методология. - М: Наука, 1980.

  2. Дегтярев Ю.П. Исследование операций. - М.: Высшая школа, 1986.

  3. Корбут А.А., Финкелыптейн Ю.Ю. Дискретное программирование. -М.:Мир, 1978.

  4. Кристофвдес Н. Теория графов. Алгоритмический подход. - М.: Мир, 1978.

  5. Липский В. Комбинаторика для программистов. - М.: Мир, 1988.

  6. Клейнрок Л. Теория массового обслуживания. - М.: Машиностроение, 1979.

  7. Ивченко Г.И. и др. Теория массового обслуживания. - М. Высшая школа, 1982.

  8. Шенок Р. Имитационное моделирование систем - искусство и наука.-М.: Мир, 1978.

  9. Гудман С, Хидегниеми С. Введение в разработку и анализ алгоритмов. - М.: Мир, 1981.

  10. Гмурман В.Е. Теория вероятностей и математическая статистика. Москва «Высшая школа» 1998.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]