Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы по курсу (часть 1).docx
Скачиваний:
50
Добавлен:
14.06.2020
Размер:
7.69 Mб
Скачать

13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.

Рассмотрим игру (модель конфликтной ситуации), в которой участвуют два игрока A и B, имеющие прямо противоположные интересы, поэтому выигрыш одного равен проигрышу другого. Такая игра называется парной игрой с нулевой суммой. Если игрок A выигрывает a, то игрок B при этом выигрывает −a, поэтому сумма выигрышей всегда равна нулю. Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока. При конечном числе стратегий игра будет конечной. Пусть у игрока A имеется m возможных стратегий A1, A2, …, Am, а у игрока B – n возможных стратегий B1, B2, …, Bn. Пусть также известны величины aij – выигрыши игрока A при использовании Ai с его стороны и Bj со стороны противника. Тогда игра, называемая игрой m×n, может быть представлена таблицей, называемой платежной матрицей Bj или просто матрицей игры (табл. 1).

Таблица 1

Bj

Ai

B1

B2

Bn

A1

A2

Am

Приведение игры к матричной форме может само по себе составить трудную задачу, однако таким путем многоходовая игра фактически сводится к одноходовой – от игрока требуется сделать только один ход: выбрать подходящую стратегию. Для данного игрока среди всех стратегий имеется оптимальная, обеспечивающая ему максимальный выигрыш. Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.

14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.

По платежной матрице (см. предыдущий вопрос) игры определяется нижняя α и верхняя β цены игры. Допустим, что (выбираем минимальное число в строке, записываем их рядом и у нас получается столбец из минимальных значений), (выбираем максимальное число в столбце – строка из максимальных), тогда

(из выписанных сбоку в столбец минимальных значений ищем максимальное)

(из выписанных снизу в строку максимальных значений ищем минимальное)

Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α=β. Тогда у матрицы есть седловая точка (это месторасположение совпавшего числа (чистой стратегии) в матрице аля (2,3) – то есть вторая строка третий столбец). а величина 𝛄=α=β называется ценой игры. Стратегии Ai и Bj, при которых достигается выигрыш 𝛄, называются оптимальными чистыми стратегиями, а их совокупность – решением игры.

Возможно, еще подойдет первая часть решения задачи из пункта 3.2 (она будет в самом конце).