Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка ИО.doc
Скачиваний:
4
Добавлен:
01.09.2019
Размер:
2.32 Mб
Скачать

2.2 Построение математической модели и критерий оптимизации.

Для смешанной стратегии вероятности выигрыша стороны А и проигрыша стороны В будут:

(2.11)

Выигрыш сторона А определяется как математическое ожидание выигрыша, которое максимизирует средний выигрыш:

Y= max

т.е критерий оптимизации:

Y= max (2.12)

где Cij - значения элементов матрицы выигрышей стороны А.

2.3 Алгоритм метода решения.

Для получения оптимальных вероятностей использования стратегий A1,......, Ai,....,An (или для соответственно B1,...,Bj,....,Bm), необходимо взять соответствующие частные произведения от целевой функции, приравнять их нулю и решить систему уравнений:

(i=1,2,...,n)

(2,13)

(j=1,2,3...,m)

относительно и .

Например, дана игровая матрица в таблице 2.2

Таблица 2.2

Ai Bj

B1

B2

A1

C11

C12

A2

C21

C22

Требуется определить оптимальные смешанные стратегии, т.е. выигрыш стороны А обеспечивается стратегией.

При этом наименьший проигрыш стороны В будет:

Математическая модель этой задачи

Y= max (2.14)

При этом : ;

а критерий оптимизации:

Y= max

Взяв частные производные и составив систему:

(2.15)

определим значения:

Подставим эти значения в (2.14) и получим максимальный средний выигрыш Ymax.

Для случая приведенного в таблице 2.2 обозначим:р1, тогда р2=1-р. Подставим эти значения в (2.14), взяв частные производные и решив систему уравнений получим:

= ; =

Подставим эти значения

в целевую функцию Y и получим максимальный средний выигрыш стороны А:

Ymax= (2.16)

Анализ этой формулы показывает, что при

игра становится безобидной, т.е. беспроигрышной, при этом необходимо:

(2.17)

Найденное значение Ymax составляет цену игры S, т.е.

S=Ymax, при этом a<=S<= в

т.е. применение оптимальной стратегии стороной А обеспечивает ей выигрыш при любых действиях стороны В, не меньше цены игры, поэтому:

j=1,2,...,n (2.18)

Аналогично для стороны В оптимальная стратегия должна обеспечить при любых стратегиях игрока А, проигрыш, не превышающий величину S, поэтому

i=1,2,....,m (2.19)

Таким образом, задача определения оптимальной стратегии стороны А имеет следующие ограничения:

(2. 20)

Разделим левую и правую части системы (2.20) на S, обозначим Pi/S=ti и получим:

(2. 21)

Выражение (2.9а) разделим на S и получим:

=1/S (2.22)

В результате решения игровой задачи необходимо получить для стороны А максимальное значения S, тогда выражение (2.22) можно представить в виде

Z= min (2.23)

при этом необходимо ti>=0.

Таким образом игровая задача приведена к задаче линейного программирования с целевой функцией (2.23) и ограничениях (2.21). Решая последнюю, находим значения которые составляют вектор оптимальных значений для стратегии (2.9) выигрышной стороны А.

Аналогично с (2.19) и (2.20) получим для стратегии проигрышной стороны В:

(2. 24)

Разделим левую и правые части системы (2.24) на S, обозначим /S=Uj и получим:

(2. 25)

Аналогично с (2.22) и (2.23) на основании (2.10а) получим:

U1+U2+......+Un=1/S (2.26)

W max (2.27)

Решая, находим =UjS вектор Анализируя системы ограничений (2.21) и (2.25), которые получены на основе матрицы (2.1), можно показать, что система (2.25) является двойственной по отношению к системе(2.21).

Таким образом, для нахождения оптимального решения игры получено две двойственных симметричных задачи линейного программирования:

первая задача с системой (2.21) и критерием (2.23);

вторая задача с системой (2.25) и критерием (2.27).

Используя свойство симметричности можно решить одну из них, где будет меньше вычислений, а решение другой найти на основании оптимального плана двойственной:

(2.28) где i=1,2,...,m ; j=1,2,....,n

Цену игры S определим из последнего, оптимального плана симплекс - таблицы, учитывая

Wmax=1/S или Zmin=1/S (2.29)

Значения переменных - по значениям переменных, введенных в базис оптимального плана, а значения переменных двойственной задачи - по значениям, полученным в столбцах переменных, введенным в базис начального опорного плана, в строке целевой функции.