
4. Порядок работы с программой
Для расчета результатов игры разработана программа ²Имитационное моделирование парной игры с нулевой суммой². Программа написана на алгоритмическом языке VISUAL BASIC и оформлена в виде модуля табличного процессора EXCEL. Программа позволяет вычислять оптимальные стратегии противоборствующих сторон в парной игре с нулевой суммой, а также вычислять цену игры при заданных стратегиях сторон.
Решение игры в оптимальных стратегиях дает цену игры, как среднее значение ее результата при многократном розыгрыше. При конечном числе розыгрышей средний результат может не совпадать с теоретическим прогнозом. Поэтому интересным представляется вопрос об определении фактической цены игры по результатам заданного числа розыгрышей. Данная задача также решается с помощью программы ²Имитационное моделирование парной игры с нулевой суммой². При этом проводится имитационное моделирование парной игры при заданных стратегиях сторон для оценивания параметров распределения вероятностей цены игры.
Очень часто в игровых ситуациях одна из сторон обладает частичной информацией о том, как действует другая сторона. Имитационное моделирование таких ситуаций также проводится с помощью программы ²Имитационное моделирование парной игры с нулевой суммой².
Рассмотрим порядок работы с программой на примере парной игры со следующей платежной матрицей.
Таблица 5.
-
Ai
Bj
В1
В2
В3
В4
В5
А1
4
6
2
3
6
А2
5
9
6
7
1
А3
8
8
0
3
7
А4
6
2
0
8
2
А5
2
8
8
9
9
При загрузке файла, содержащего программу, на экран дисплею выводится таблица исходных данных и 4 управляющие кнопки:
1. Генерация массивов.
2. Расчет оптимальных стратегий.
3. Цена игры.
4. Таблица стратегий информированности.
5. Моделирование игры с информированным противником.
Перед началом вычислений необходимо заполнить таблицу исходных данных, которая для рассматриваемого примера имеет вид.
Таблица 6.
Исходные данные
№ |
Название параметра |
Значение |
1. |
Количество стратегий стороны А |
5 |
2. |
Количество стратегий стороны В |
5 |
3. |
Нижняя граница матрицы дохода |
0 |
4. |
Верхняя граница матрицы дохода |
0 |
5. |
Число этапов моделирования |
1 |
6. |
Информированность противника |
0 |
7. |
Доля информированности |
0 |
8. |
Число стратегий информированности |
1 |
При вводе исходных данных производится контроль корректности их значений. Исходные данные обязаны удовлетворять следующим условиям:
а) количество стратегий m и n сторон А и В: 1 £ m £ 10 , 1 £ n £ 10;
б) нижняя граница а матрицы дохода должна быть не больше верхней границы b;
в) число k этапов моделирования: 1 £ k £ 10000;
г) признак информированности противника принимает значения 0, 1 или 2;
д) доля информированности dи £ 1;
е) число стратегий информированности mи £ m.
Элементы таблицы “Исходные данные” с 5-го по 8-ой при теоретическом расчете оптимальных стратегий не используются. Необходимо лишь выполнить требования, учитываемые при вводе исходных данных:
Нижняя а и верхняя b границы матрицы дохода определяют диапазон возможных значений элементов платежной матрицы при ее автоматическом генерации с помощью программы. Принимается, что элементы матрицы являются реализациями равномерно распределенной на интервале (a, b) случайной величины. При генерации платежной матрицы используется следующая формула:
aij = a + r×(b - a),
где r - равномерно распределенная на интервале (0, 1) случайная величина, генерируемая датчиком случайных чисел.
Использование сгенерированной платежной матрицы сокращает время ввода исходных данных и может применяться при изучении методов расчета парных игр и свойств их решения.
Если необходимо использовать заданную платежную матрицу, то границы a и b целесообразно принять равными 0. Тогда все элементы матрицы при формировании таблицы для ее ввода будут равны 0, и в соответствующие клетки вносятся фактические значения.
При заполненной таблице исходных данных после нажатия кнопки “Генерация массивов” на лист Расчет выводится таблица для ввода платежной матрицы, элементы которой сгенерированы по описанному выше правилу. Для рассматриваемого примера все элементы таблицы равны 0 и должны быть заменены заданными значениями.
Таблица исходных данных и платежная матрица составляют объем необходимой информации для расчета оптимальных смешанных стратегий сторон и цены игры. Запуск программы, реализующей алгоритм симплекс-метода для расчета оптимальных стратегий, производится при нажатии кнопки “Расчет оптимальных стратегий”. После отработки программы результаты выводятся в таблицы, формируемые на листе Расчет.
Лист Расчет после отработки программы для рассматриваемого примера имеет вид.
Таблица 7.
Исходные данные
№ |
Название параметра |
Значение |
1. |
Количество стратегий стороны А |
5 |
2. |
Количество стратегий стороны В |
5 |
3. |
Нижняя граница матрицы дохода |
0 |
4. |
Верхняя граница матрицы дохода |
0 |
5. |
Число этапов моделирования |
1 |
6. |
Информированность противника |
0 |
7. |
Доля информированности |
0 |
8. |
Число стратегий информированности |
1 |
Таблица 8.
Платежная матрица
|
В1 |
В2 |
В3 |
В4 |
В5 |
А1 |
4 |
6 |
2 |
3 |
6 |
А2 |
5 |
9 |
6 |
7 |
1 |
А3 |
8 |
8 |
0 |
3 |
7 |
А4 |
6 |
2 |
0 |
8 |
2 |
А5 |
2 |
8 |
8 |
9 |
9 |
Таблица 9.
Оптимальная стратегия стороны А
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0 |
0.439 |
0.272 |
0 |
0.289 |
Таблица 10.
Оптимальная стратегия стороны В
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.526 |
0 |
0.368 |
0 |
0.105 |
Таблица 11.
Цена игры |
4.947 |
Таким образом решение игры в смешенных стратегиях имеет вид:
и цена игры .
Разработанная программа ²Имитационное моделирование парной игры с нулевой суммой² позволяет рассчитывать ожидаемый результат игры при заданных смешанных стратегиях сторон. Пусть сторона А использует смешанную стратегию:
,
а сторона В - смешанную стратегию:
.
Тогда вероятность того, что при единичном розыгрыше будет реализован результат игры rij , на основании теоремы о вероятности произведения независимых событий, равна:
P(rij) = pi qj .
Ожидаемый результат игры есть математическое ожидание единичного розыгрыша, поэтому для его расчета используется формула:
.
При нажатии кнопки “Цена игры” реализуется данный алгоритм расчета.
Программа ²Имитационное моделирование парной игры с нулевой суммой² позволяет рассчитывать ожидаемый результат игры в случае, когда сторона В частично информирована о действиях стороны А. Степень информированности можно определить двумя способами:
1) долей информированности dи , которая определяется формулой:
dи = kи /k,
где kи - число розыгрышей, в которых сторона В информирована о действиях стороны А;
k - общее число розыгрышей;
2) номерами стратегий информированности li, при выборе которых стороной А сторона В информирована о сделанном выборе.
Информированность стороны В означает, что она выбирает наилучший для себя ответ на известный выбор стороны А.
Признак информированности задается в исходной таблице в строке “Информированность противника” и принимает следующие значения:
1) 0 - если розыгрыш проводится без информированности;
2) 1 - если информированность стороны В задается долей информированности;
3) 2 - если информированность стороны В задается перечислением номеров стратегий информированности.
Если признак информированности равен 1, то необходимо определить долю информированности в исходной таблице.
Если признак информированности равен 2, то необходимо определить количество стратегий информированности в исходной таблице. Таблица для ввода номеров стратегий информированности выводится на лист Расчет ниже оптимальных смешанных стратегий при нажатии кнопки “Таблица стратегий информированности”.
Выбор действий стороны В при использовании доли информированности dи определяется с помощью датчика случайных чисел:
если r < dи , то сторона В информирована о выборе стратегии стороной А;
если r ³ dи , то сторона В действует в соответствии со своей оптимальной стратегией.
Для
игры с информированным противником при
заданной доле информированности
вычисляются вероятности
того,
что будет реализован результат игры
rij
при известной стратегии Ai
стороны А,
по формуле:
Pd(rij) = 1, если j = jm ,
Pd(rij) = 0, если j ¹ jm .
Тогда ожидаемый результат игры вычисляется по формуле:
.
Если информированность стороны В задается номерами стратегий информированности, то расчет ожидаемого результата игры производится по формуле:
,
где
- для
номеров i
стратегий стороны А,
не входящих в число стратегий
информированности, и
P(rij) = 1, если j = jm
P(rij) = 0, если j ¹ jm .
для номеров i стратегий стороны А, входящих в число стратегий информированности.
Рассмотрим последствия отклонения от оптимальной стратегии для неинформированных сторон. Изменим смешанную стратегию стороны А и рассмотрим, как изменится результат игры. Лист Расчет после отработки программы при нажатии кнопки “Цена игры” имеет следующий вид.
Таблица 12.
Исходные данные
№ |
Название параметра |
Значение |
1. |
Количество стратегий стороны А |
5 |
2. |
Количество стратегий стороны В |
5 |
3. |
Нижняя граница матрицы дохода |
0 |
4. |
Верхняя граница матрицы дохода |
0 |
5. |
Число этапов моделирования |
100 |
6. |
Информированность противника |
0 |
7. |
Доля информированности |
0 |
8. |
Число стратегий информированности |
1 |
Таблица 13.
Платежная матрица
|
В1 |
В2 |
В3 |
В4 |
В5 |
А1 |
4 |
6 |
2 |
3 |
6 |
А2 |
5 |
9 |
6 |
7 |
1 |
А3 |
8 |
8 |
0 |
3 |
7 |
А4 |
6 |
2 |
0 |
8 |
2 |
А5 |
2 |
8 |
8 |
9 |
9 |
Таблица 14.
Оптимальная стратегия стороны А
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.1 |
0.3 |
0.3 |
0.1 |
0.2 |
Таблица 15.
Оптимальная стратегия стороны В
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.526 |
0 |
0.368 |
0 |
0.105 |
Таблица 16.
Цена игры |
4.642 |
В соответствии с теоремой теории игр получено ухудшение результата игры для стратегии А, допустившей отклонение от оптимальной стратегии.
Пусть в рассматриваемом примере задана доля информированности dи = 0,4 стороны В. Примем, что розыгрыш проводится в соответствии с оптимальными стратегиями. Тогда лист Расчет после нажатия кнопки “Цена игры” имеет вид.
Таблица 17.
Исходные данные
№ |
Название параметра |
Значение |
1. |
Количество стратегий стороны А |
5 |
2. |
Количество стратегий стороны В |
5 |
3. |
Нижняя граница матрицы дохода |
0 |
4. |
Верхняя граница матрицы дохода |
0 |
5. |
Число этапов моделирования |
100 |
6. |
Информированность противника |
1 |
7. |
Доля информированности |
0.4 |
8. |
Число стратегий информированности |
1 |
Таблица 18.
Платежная матрица
|
В1 |
В2 |
В3 |
В4 |
В5 |
А1 |
4 |
6 |
2 |
3 |
6 |
А2 |
5 |
9 |
6 |
7 |
1 |
А3 |
8 |
8 |
0 |
3 |
7 |
А4 |
6 |
2 |
0 |
8 |
2 |
А5 |
2 |
8 |
8 |
9 |
9 |
Таблица 19.
Оптимальная стратегия стороны А
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.0 |
0.439 |
0.272 |
0.0 |
0.289 |
Таблица 20.
Оптимальная стратегия стороны В
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.526 |
0 |
0.368 |
0 |
0.105 |
Таблица 21.
Цена игры |
3.375 |
Цена игры изменилась в пользу информированной стороны.
Пусть в рассматриваемом примере заданы стратегии информированности: 1-ая, 2-ая и 3-я (то есть при выборе стороной А этих стратегий сторона В отвечает своей наилучшей стратегией). Таким образом количество стратегий информированности равно 3. Для ввода стратегий информированности сначала нажимается кнопка “Таблица стратегий информированности” и в сформированную таблицу вводятся номера этих стратегий. После нажатия кнопки “Цена игры” лист Расчет имеет вид.
Таблица 22.
Исходные данные
№ |
Название параметра |
Значение |
1. |
Количество стратегий стороны А |
5 |
2. |
Количество стратегий стороны В |
5 |
3. |
Нижняя граница матрицы дохода |
0 |
4. |
Верхняя граница матрицы дохода |
0 |
5. |
Число этапов моделирования |
100 |
6. |
Информированность противника |
2 |
7. |
Доля информированности |
0 |
8. |
Число стратегий информированности |
3 |
Таблица 23.
Платежная матрица
|
В1 |
В2 |
В3 |
В4 |
В5 |
А1 |
4 |
6 |
2 |
3 |
6 |
А2 |
5 |
9 |
6 |
7 |
1 |
А3 |
8 |
8 |
0 |
3 |
7 |
А4 |
6 |
2 |
0 |
8 |
2 |
А5 |
2 |
8 |
8 |
9 |
9 |
Таблица 24.
Оптимальная стратегия стороны А
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.0 |
0.439 |
0.272 |
0.0 |
0.289 |
Таблица 25.
Оптимальная стратегия стороны В
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.526 |
0 |
0.368 |
0 |
0.105 |
Таблица 26.
Цена игры |
1.871 |
Таблица 27.
Номера стратегий информированности |
|||
Стратегия |
1 |
2 |
3 |
Номер |
1 |
2 |
3 |
Цена игры снова изменилась в пользу информированной стороны.
Во многих приложениях теории игр представляет интерес не столько среднее значение цены игры, сколько интервал, в который попадет эта величина с заданной надежностью при заданном числе розыгрышей, то есть ставится задача интервального оценивания результата игры. Для ее решения используется имитационное моделирование игры.
При имитационном моделировании парной игры по заданному количеству этапов проводится определение результата игры в каждом розыгрыше. Выбор чистых стратегий сторон на каждом этапе игры проводится в соответствии с заданной смешанной стратегией сторон. Для этого используется процедура розыгрыша дискретной случайной величины следующего вида. Каждая смешанная стратегия считается законом распределения случайной величины Z - номера чистой стратегии. Возможные значения этой случайной величины Z для стороны А изменяются в пределах от 1 до m , а для стороны В - в пределах от 1 до n. Например, для стороны А, закон распределения дискретной случайной величины Z имеет вид:
Таблица 28.
-
Z
1
2
...
m
p
p1
p2
...
pm
Для каждого закона распределения составляется вспомогательный массив, элементы которого вычисляются по формулам:
-
для стороны А,
-
для стороны В.
При этом g0 = 0.
Стратегия Аi стороны А выбирается из условия, что:
gi-1 £ r < gi ,
где r - случайное число на интервале (0, 1) , полученное с помощью датчика случайных чисел.
Если игра проводится в условиях информированности стороны В, то правило выбора стратегии стороны В изменяется. При заданных стратегиях информированности, сторона В выбирает свою наилучшую стратегию, если для стороны А выбирается одна из стратегий информиролванности. При заданной доле информированности производится розыгрыш дискретной случайной величины Z, со следующим законом распределения:
Таблица 29.
-
z
0
1
p
dи
1- dи
Если в результате розыгрыша Z = 0, то на выбранную стратегию стороны А сторона В выбирает свою наилучшую стратегию. Если Z = 1, то розыгрыш игры проводится в соответствии с оптимальными смешанными стратегиями.
Производя
k
этапов имитационного моделирования
для оцениваемого параметра n
получаем
выборку его значений ni
,
.
В качестве точечной оценки математического
ожидания принимается выборочная средняя,
вычисляемая на i-ом
этапе моделирования по формуле:
,
где
- выборочная
средняя, вычисляемая по i
значениям выборки.
В качестве точечной оценки среднего квадратического отклонения s принимается исправленное выборочное среднее квадратическое отклонение s, вычисляемое на i-ом этапе моделирования по формуле:
где si - исправленное выборочное среднее квадратическое отклонение, вычисленное по i значениям выборки.
Принимается, что n0 = 0, s0 = s1 = 0.
По
полученной выборке определяются
доверительные интервалы для математического
ожидания цены игры n
по выборочному среднему
и выборочному среднему квадратическому
отклонению s,
по формуле:
,
где tg - квантиль распределения Стьюдента, определяемый по таблицам /4/.
Проведем имитационное моделирование в рассмотренном выше примере парной игры на 1000 розыгрышей для оптимальных смешанных стратегий сторон. Запуск программы, реализующей данный алгоритм, осуществляется нажатием кнопки “Имитационное моделирование”. В процессе моделирования на лист Расчет выводится таблица “Результаты моделирования”, в которой отражаются текущие значения выборочных характеристик, а по окончанию расчета содержатся окончательные значения.
По окончании моделирования на лист Расчет выводятся таблицы “Теоретические вероятности” и “Частоты”. Каждый элемент (i, j) первой таблицы вычисляется, как произведение piqj , и равен вероятности реализации результата игры rij в единичном розыгрыше. Каждый элемент (i, j) таблицы “Частоты” равен фактической частоте реализации этого результата в процессе имитационного моделирования и является точечной оценкой соответствующего элемента таблицы “Теоретические вероятности”.
Лист Расчет после проведения имитационного моделирования в игре без информированности сторон имеет вид.
Таблица 30.
Исходные данные
№ |
Название параметра |
Значение |
1. |
Количество стратегий стороны А |
5 |
2. |
Количество стратегий стороны В |
5 |
3. |
Нижняя граница матрицы дохода |
0 |
4. |
Верхняя граница матрицы дохода |
0 |
5. |
Число этапов моделирования |
1 |
6. |
Информированность противника |
0 |
7. |
Доля информированности |
0 |
8. |
Число стратегий информированности |
1 |
Таблица 31.
Платежная матрица
|
В1 |
В2 |
В3 |
В4 |
В5 |
А1 |
4 |
6 |
2 |
3 |
6 |
А2 |
5 |
9 |
6 |
7 |
1 |
А3 |
8 |
8 |
0 |
3 |
7 |
А4 |
6 |
2 |
0 |
8 |
2 |
А5 |
2 |
8 |
8 |
9 |
9 |
Таблица 32.
Оптимальная стратегия стороны А
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0 |
0.439 |
0.272 |
0 |
0.289 |
Таблица 33.
Оптимальная стратегия стороны В
Стратегии |
1 |
2 |
3 |
4 |
5 |
Частоты |
0.526 |
0 |
0.368 |
0 |
0.105 |
Таблица 34.
Цена игры |
4.947 |
Таблица 35.
Результаты моделирования
Номер этапа |
1000 |
Средний доход |
4.991 |
Среднее отклонение |
2.744 |
Расчет окончен
Таблица 36.
Теоретические вероятности
|
В1 |
В2 |
В3 |
В4 |
В5 |
А1 |
0 |
0 |
0 |
0 |
0 |
А2 |
0.231 |
0 |
0.162 |
0 |
0.046 |
А3 |
0.143 |
0 |
0.100 |
0 |
0.029 |
А4 |
0 |
0 |
0 |
0 |
0 |
А5 |
0.152 |
0 |
0.107 |
0 |
0.030 |
Таблица 37.
Частоты
|
В1 |
В2 |
В3 |
В4 |
В5 |
А1 |
0 |
0 |
0 |
0 |
0 |
А2 |
0.250 |
0 |
0.164 |
0 |
0.046 |
А3 |
0.139 |
0 |
0.102 |
0 |
0.027 |
А4 |
0 |
0 |
0 |
0 |
0 |
А5 |
0.134 |
0 |
0.100 |
0 |
0.038 |
Таким образом, по результатам моделирования получено выборочное среднее цены игры = 4.991, и выборочное среднее квадратическое отклонение s = 2.744. Принимая уровень доверительной вероятности g = 0.95 получим значение квантиля tg = 1.96. Тогда доверительный интервал для цены игры в данных условиях имеет вид:
n Î (4.682; 5.300).
Для розыгрыша парной игры с информированным противником, необходимо задать параметры информированности так же, как и при теоретическом расчете цены игры.