Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб. 5_Теория игр. Парные игры.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
624.13 Кб
Скачать

Пример 1

Найти решение парной игры 4х4 в смешанных стратегиях, если платежная матрица имеет вид, приведенный на Рис.5.3. Провести имитационное моделирование розыгрыша этой парной игры при условиях:

  1. оба игрока придерживаются своих оптимальных стратегий;

  2. игрок А придерживается своей оптимальной стратегии, а игрок В играет неактивную стратегию, т.е. ту чистую стратегию, вероятность которой равна нулю в его оптимальной смешанной стратегии;

  3. игрок А придерживается своей оптимальной стратегии, а игрок В играет одну из активных стратегий, т.е. ту чистую стратегию, вероятность которой неравна нулю в его оптимальной смешанной стратегии;

  4. игрок В придерживается своей оптимальной стратегии, а игрок А играет неактивную стратегию, т.е. ту чистую стратегию, вероятность которой равна нулю в его оптимальной смешанной стратегии. игрок А придерживается своей оптимальной стратегии, а игрок В играет неактивную стратегию, т.е. ту чистую стратегию, вероятность которой равна нулю в его оптимальной смешанной стратегии;

  5. игрок В придерживается своей оптимальной стратегии, а игрок А играет одну из активных стратегий, т.е. ту чистую стратегию, вероятность которой неравна нулю в его оптимальной смешанной стратегии;.

Для всех вариантов выполнить не менее 300 розыгрышей. Провести анализ моделирования.

Стратегии

Стратегии игрока В

игрока А

B1

B2

B3

B4

А1

8

8

11

13

А2

8

9

10

9

А3

12

7

6

11

А4

9

11

12

10

Рис.5.3. Платежная матрица.

Решение.

Все вычисления приведены на рис.5.4  рис. 5.10.

Вначале вычислим верхнюю и нижнюю цены игры.

Нижняя цена содержится в ячейке С18. Для ее вычисления использованы значения ячеек F12:F15, в которых вычисляется минимальное значение по соответствующей строке платежной матрицы. Далее выбираем наибольшее значение из них max8;8;6;9 = 9.

Верхняя цена содержится в ячейке С19. Для ее вычисления использованы значения ячеек B16:E16, в которых вычисляется максимальное значение по соответствующему столбцу платежной матрицы. Далее выбираем наименьшее значение из них min12;11;12;13 =11

Нижняя и верхняя цены игры не равны, из этого следует, что решения в чистых стратегиях не существует и его необходимо искать в смешанных стратегиях.

Рис. 5.4. Фрагмент электронных таблиц MS Excel в режиме отображения данных (начало) для решения примера 1.

Рис. 5.5. Фрагмент электронных таблиц MS Excel в режиме отображения формул (начало) для решения примера 1.

Сведем данную матричную игру к паре двойственных задач линейного программирования (ЛП).

Для определения оптимальной стратегии игрока А составляем задачу ЛП, используя соотношения (5.8)(5.10). В результате получаем следующие соотношения

(5.15)

Эта задача ЛП может быть решена с помощью надстройки «Поиск решения» (рис. 5.8). Для этого в ячейки B32:B35, где будут находиться значения искомых величин xi, введем произвольные значения, например, все единицы. В ячейку B36 вводим формулу =СУММ(B32:B35), это будет значение целевой функции.

Рис. 5.6. Фрагмент электронных таблиц MS Excel в режиме отображения данных (продолжение) для решения примера 1.

Рис. 5.7. Фрагмент электронных таблиц MS Excel в режиме отображения формул (продолжение) для решения примера 1.

В ячейки A39:A42 поместим значения левых частей ограничений (неравенств) в соотношении (5.15). В ячейку A39 запишем формулу =СУММПРОИЗВ(B12:B15;$B$32:$B$35), которая обеспечивает вычисление суммы произведений соответствующих элементов первого столбца платежной матрицы на значения искомых xi. В остальных ячейках (A40:A42) записываем аналогичные формулы (Рис. 5.6). В ячейки диапазона С39:С42 для хранения правых частей ограничений (5.15) введем единицы. На этом подготовительные операции для применения надстройки «Поиск решения» закончены. Далее вызываем надстройку «Сервис»  «Поиск решений». В появившемся диалоговом окне заполняем поля, как показано на Рис. 5.8. После этого нажимаем кнопку «Выполнить» и в результате получаем следующее:

  • диалоговое окно с характеристиками полученного результата, показанное на Рис. 5.9.

  • в ячейках B32:B35 находятся значения искомых величин (x1 ; x2 ; x3 ; x4 ) =(0; 0; 0,028985507; 0,072463768);

  • в ячейке B36 значение целевой функции (0,1014).

Используя последнее значение, находим цену игры = =1/0,1014=9,857142857  9,86. Далее, учитывая соотношение , находим искомые вероятности (p1 ;p2 ; p3 ; p4 )=(0; 0; 0,29; 0,71). Например, для p3 = 9,86*0,028985507=0,285714286  0,29

Рис.5.8. Диалоговое окно надстройки «Поиск решения» при поиске оптимальной стратегии игрока А

Рис.5.9. Диалоговое окно результата работы

надстройки « Поиск решения»

Для определения оптимальной стратегии игрока В составляем задачу ЛП, используя соотношения (5.12)(5.14). В результате получаем следующие соотношения:

(5.16)

Эта задача ЛП также может быть решена с помощью надстройки «Поиск решения». Порядок решения показан на Рис. 5.10. Рис. 5.11. Значение целевой функции (ЦФ) для этой задачи ЛП полностью совпадает со значением ЦФ задачи ЛП, определяемой соотношениями (5.15) для игрока  А, поскольку эти задачи являются двойственными.

Используя значение целевой функции, повторно (для самопроверки) находим цену игры =1/0,1014=9,857142857  9,86

Рис. 5.10. Фрагмент электронных таблиц MS Excel в режиме отображения данных (продолжение) для решения примера 1.

Рис. 5.11. Фрагмент электронных таблиц MS Excel в режиме отображения формул (продолжение) для решения примера 1.

Далее, учитывая соотношение , находим искомые вероятности (q1 ;q2 ; q3 ; q4 )=( 0,57; 0,43; 0; 0). Например, для q1 = 9,857142857*0,057971014 =0,5714286  0,57

Зная цену игры и вероятности применения стратегий каждого игрока, записываем результат. Решением игры является вектор (0, 0 ,0.29, 0.71; 0.57, 0.43, 0, 0; 9,86).

Проведем имитационное моделирование розыгрыша этой парной игры.

Рассмотрим случай, когда оба игрока придерживаются своих оптимальных стратегий.

Выбор стратегии игрока A будем осуществлять с помощью генератора случайных чисел, который генерирует значение случайной величины, имеющей следующее распределение:

xi

3

4

pi

0.29

0.71

Чтобы обеспечить реализацию этой случайной величины в MS Excel используем функцию СЛЧИС(), которая вычисляет значения равномерно распределенной случайной величины в интервале [0;1]. Пусть число является значением функции СЛЧИС(), тогда величина , вычисленная по правилу

будет иметь искомое распределение.

Аналогично выбор стратегии игрока В будем осуществлять с помощью генератора случайных чисел, который генерирует значение случайной величины, имеющей следующее распределение:

yi

1

2

qi

0.57

0.43

Пусть число является значением функции СЛЧИС(), тогда величина , вычисленная по правилу

будет иметь искомое распределение.

Решение приведено на Рис. 5.12-3.16. Каждому розыгрышу игры соответствует одна строчка таблицы. В интервалах С101:С400 и E101:E400 содержатся реализации искомых случайных величин, т.е. номера стратегий, которые будут использовать игроки в данной игре. Величина выигрыша игрока А указана в интервале F101:400. Далее скопируем полученные значения на другой лист рабочей книги. Это необходимо сделать для обеспечения неизменности полученных результатов, поскольку функция СЛЧИС(), возвращает новое значение при каждом изменении на рабочем листе.

Рис. 5.12. Фрагмент электронных таблиц MS Excel в режиме отображения данных. Имитационное моделирование игры (оба игрока придерживаются своих оптимальных стратегий)(Начало).

Рис. 5.13. Фрагмент электронных таблиц MS Excel в режиме отображения данных. Имитационное моделирование игры (оба игрока придерживаются своих оптимальных стратегий) )(Окончание).

Рис. 5.14. Фрагмент электронных таблиц MS Excel в режиме отображения формул. Имитационное моделирование игры (оба игрока придерживаются своих оптимальных стратегий)(Начало).

Рис. 5.15. Фрагмент электронных таблиц MS Excel в режиме отображения формул. Имитационное моделирование игры (оба игрока придерживаются своих оптимальных стратегий)(окончание)

В ячейке F402 получен средний выигрыш игрока А, после проведения 300 розыгрышей, он оказался равным 9,806, что отличается от цены игры приблизительно на (9,86-9,806)/9,86*100%=0,5%. Относительная частота использования игроком А 3 и 4 стратегий равны 0.293 и 0.707, что незначительно отличается от вычисленных вероятностей 0.29 и 0.71.

Относительная частота использования игроком В 1 и 2 стратегий равны 0.620 и 0.380, что несколько отличается от вычисленных вероятностей 0.57 и 0.43. Так отличие в реализации 1 стратегии составило (0.620-0.57)/0.57*100%=8.8%. Это отличие объясняется случайностью при реализации случайной величины.

Результаты имитационного моделирования игры, в которой игрок А придерживается своей оптимальной стратегии, а игрок В играет четвертую стратегию приведен на Рис.5.15. Как и следовало ожидать, величина выигрыша игрока А увеличилась (10.32 против 9.856).

Рис. 5.16. Фрагмент электронных таблиц MS Excel в режиме отображения данных. Имитационное моделирование игры (игрок А придерживается своей оптимальной стратегии, а игрок В играет неактивную стратегию)

Результаты имитационного моделирования игры, в которой игрок В придерживается своей оптимальной стратегии, а игрок А играет вторую стратегию приведен на Рис.5.17. Вполне ожидаемо, величина выигрыша игрока А уменьшилась(8.43 против 9.856).

Рис. 5.17. Фрагмент электронных таблиц MS Excel в режиме отображения данных. Имитационное моделирование игры (игрок В придерживается своей оптимальной стратегии, а игрок А играет вторую стратегию)

Результаты имитационного моделирования игры, в которой игрок А придерживается своей оптимальной стратегии, а игрок В играет первую стратегию приведен на Рис.5.18. Как и следовало ожидать, величина выигрыша игрока А практически не изменилась по сравнению с базисным вариантом (9.851 против 9.856).

Рис. 5.18. Фрагмент электронных таблиц MS Excel в режиме отображения данных. Имитационное моделирование игры (игрок А придерживается своей оптимальной стратегии, а игрок В играет первую стратегию)

Ответ: решением игры является вектор (0, 0 ,0.29, 0.71; 0.57, 0.43, 0, 0; 9,86). Сводные результаты имитационного моделирования игры (300 партий в каждом случае) приведены на рис.19.

Рис. 5.19. Фрагмент электронных таблиц MS Excel в режиме отображения данных. Сводные результаты имитационного моделирования игры (300 партий в каждом случае)

Анализ моделирования 1-3 вариантов фактически проведен в ходе решения. Анализ 4 и 5 вариантов проведите самостоятельно после изучения примера 2.