13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.

Рассмотрим игру (модель конфликтной ситуации), в которой участвуют два игрока A и B, имеющие прямо противоположные интересы, поэтому выигрыш одного равен проигрышу другого. Такая игра называется парной игрой с нулевой суммой. Если игрок A выигрывает a, то игрок B при этом выигрывает −a, поэтому сумма выигрышей всегда равна нулю. Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока. При конечном числе стратегий игра будет конечной. Пусть у игрока A имеется m возможных стратегий A₁, A₂, …, A_m, а у игрока B – n возможных стратегий B₁, B₂, …, B_n. Пусть также известны величины a_ij – выигрыши игрока A при использовании A_i с его стороны и B_jсо стороны противника. Тогда игра, называемая игрой m×n, может быть представлена таблицей, называемой платежной матрицей B_j или просто матрицей игры (табл. 1).

Таблица 1

	B_j
A_i	B₁	B₂	…	B_n
A₁			…
A₂			…
…	…	…	…	…
A_m			…

Приведение игры к матричной форме может само по себе составить трудную задачу, однако таким путем многоходовая игра фактически сводится к одноходовой – от игрока требуется сделать только один ход: выбрать подходящую стратегию. Для данного игрока среди всех стратегий имеется оптимальная, обеспечивающая ему максимальный выигрыш. Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.

14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.

По платежной матрице (см. предыдущий вопрос) игры определяется нижняя α и верхняя β цены игры. Допустим, что (выбираем минимальное число в строке, записываем их рядом и у нас получается столбец из минимальных значений), (выбираем максимальное число в столбце – строка из максимальных), тогда

(из выписанных сбоку в столбец минимальных значений ищем максимальное)

(из выписанных снизу в строку максимальных значений ищем минимальное)

Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α=β. Тогда у матрицы есть седловая точка (это месторасположение совпавшего числа (чистой стратегии) в матрице аля (2,3) – то есть вторая строка третий столбец). а величина 𝛄=α=β называется ценой игры. Стратегии A_i и B_j, при которых достигается выигрыш 𝛄, называются оптимальными чистыми стратегиями, а их совокупность – решением игры.

Возможно, еще подойдет первая часть решения задачи из пункта 3.2 (она будет в самом конце).

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1411 12 13 14 > Следующая >>>

Соседние файлы в предмете Управление в биотехнических системах

#
14.06.202053.83 Кб69ИДЗ - задание 1 (9 вариант).docx
#
14.06.202014.81 Кб55ИДЗ - задание 2 (9 вариант).docx
#
14.06.2020293.31 Кб34КР (вариант 5).docx
#
14.06.2020384.95 Кб49КР (вариант 5).pdf
#
14.06.202096.99 Кб31Манило ИДЗ (задание 9 вар).pdf
#
14.06.20207.69 Mб61Материалы по курсу (часть 1).docx
#
14.06.20207.78 Mб61Материалы по курсу (часть 2).docx
#
14.06.20202.6 Mб43Материалы по курсу (часть 2).pdf
#
14.06.20201.39 Mб82Методичка.pdf
#
14.06.2020281.63 Кб37Табличный алгоритм.pdf
#
14.06.2020897.06 Кб110Учебное пособие Немирко Манило.pdf