
- •Моделирование операций по схеме марковских случайных процессов Лекция 1. Марковский случайный процесс (сп) с дискретными состояниями и дискретным временем
- •Марковский процесс с дискретными состояниями и непрерывным временем Уравнения Колмогорова а.Н.
- •Закон распределения интервала времени между событиями в простейшем потоке
- •Приближенное сведение немарковских процессов к марковским. Метод «псевдосостояний»
- •Система массового облуживания с ожиданием
- •Смо с ожиданием с ограничением по длине очереди
- •Лекция 7. Типовые задачи по теории массового обслуживания
- •Основы теории игр Предмет теории игр. Основные понятия
- •Лекция 8. Примеры дискретных позиционных игр
- •Условная карточная игра.
- •Понятие стратегии игроков в игре
- •Лекция 9. Ситуации равновесия в игре
- •Лекция 10. Антагонистические игры
- •Основная теорема теории игр (Джон фон Нейман)
- •Теорема об активных стратегиях
- •Лекция 13.Непрерывные антагонистические игры на квадрате (игры с бесконечным числом решений)
Лекция 8. Примеры дискретных позиционных игр
Игра в шахматы.
Элементы:
Множество вершин графа-дерева игры является множеством всех возможных позиций на доске.
Множество ребер-альтернатив, исходящих из графа-дерева игры – множество возможных ходов того игрока, чей ход в данной позиции
Начальная позиция – начальная позиция шахматной игры с ходом белых.
Конечными позициями являются такие позиции, в которых для стороны, делающей ход на доске стоит мат, а также все возможные известные ничейные позиции (патовые, с одной легкой фигурой и т.п.).
Вектор-функцией выигрыша является для всех позиций мата черным пара чисел (1,0), для всех позиций мата белым – (0,1) и для всех ничейных – (1/2,1/2).
Игра без случайных ходов
(пустое множество вершин).
В множество включаются все позиции с ходом белых, в – с ходом черных.
Отсутствует, т.к. нет случайных ходов.
Область информированности для каждого игрока сводится к единственной фактической позиции, т.к. шахматы – игра с полной информацией.
Вместо нумерации альтернатив для каждой позиции можно воспользоваться шахматной нотацией для записи ходов в партии.
Условная карточная игра.
Каждому из игроков выдается полная масть колоды из 52 карт (13 карт одной масти). Третья масть тасуется и затем карты этой масти последовательно открываются одна за другой. После открытия очередной карты контрольной масти, каждая из которых оценивается в определенное количество очков, игроки делают ходы, открывая по своему выбору и не советуясь с противником одну из своих карт. Игрок, открывший старшую карту, забирает себе карту контрольной масти.
При равных по старшинству открытых игральных картах, оспариваемая карта контрольной масти признается ничьей. Игра заканчивается после открытия всех карт.
Выигрыши игроков считаются по сумме набранных очков карт контрольной масти.
Игра состоит из одного случайного (тасования колоды карт) и 13 личных ходов каждого из игроков.
Изобразим фрагмент графа-дерева игры для случая, когда в масти содержится три карты достоинством 1,2 и 3 очка.
Каждой вершине соответствует определенный набор карт, оставшихся на руках у игроков. Результатом случайного хода является одна из шести последовательностей карт (3,1,2), (3,2,1),(2,3,1),…,(1,3,2) в колоде контрольной масти.
Данная игра является игрой с полной информацией игроков, т.к. в каждой позиции игрок знает набор своих карт, набор карт противника и набор карт, оставшихся в колоде контрольной масти.
Понятие стратегии игроков в игре
Стратегия первого (второго) игрока есть функция
которая каждой области
информированности
ставит в соответствие число
являющееся номером одного из принадлежащих ей ребер альтернатив.
Т.О., стратегией игрока является система правил, однозначно определяющих выбор игроком личного хода (ребра-альтернативы) во всех возможных позициях игр, которые могут встретиться в любой партии игры.
Обозначим
– стратегии с номером i
и j первого и второго
игрока соответственно.
Принятие обоими
игроками определенной стратегии
однозначно определяет в игре без
случайных ходов реализацию игры в виде
пути по графу от начальной позиции игры
А до одной из конечных позиций игры
,
а значит и выигрыши обоих игроков
При наличии случайных ходов в игре реализация игры, а значит, и выигрыши игроков оказываются случайными.
Зная вероятностное
распределение
на множестве конечных позиций
(j=1,2,…,N)
графа, соответствующее стратегиям
игроков, можно найти математическое
ожидание случайных выигрышей обоих
игроков
Заметим, что понимание выигрышей игроков как среднего значения случайного выигрыша, допускает в качестве личного хода игрока случайный ход. При этом игрок, делающий очередной ход сам может задать на множестве альтернатив своего хода желаемое ему вероятностное распределение и предоставить ход генератору случайных числе, который будет реализовывать заданное распределение при многократных повторениях партий игры.
Иногда таким неожиданным выбором хода можно повлиять на рост математического ожидания своего выигрыша более существенно (при многократном повторении партий игры), чем постоянным выбором какой-либо определенной альтернативы. Такие стратегии называются смешанными стратегиями.
В отличие от смешанных стратегий игроков чистые стратегии соответствуют выбору во всех позициях определенных альтернатив.
Для иллюстрации целесообразности смешанных стратегий игроков при многократном повторении партий игры, рассмотрим игру в «орлянку»
Игрок 1 выбирает цифру или герб; игрок 2, не зная выбора 1 игрока, также выбирает цифру или герб.
Если оба совершают одинаковый выбор, то игрок 2 выигрывает единицу у 1го, иначе игрок 1 выигрывает единицу у 2-го.
Граф – дерево игры имеет вид (найдите ошибку):
В качестве наиболее
разумного решения для обоих игроков
оказываются случайные личные ходы с
гистограммой вероятностного распределения
по альтернативам (1/2,1/2). Действительно,
пусть второй игрок заметил, что частота
выбора герба первым игроком равна
,
тогда, выбирая для себя герб также с
частотой p, средний выигрыш
второго игрока оказался бы равным:
Если же p=1/2,
то
Выбор игроками своих
определенных стратегий
называют ситуацией игры.
Каждой ситуации игры
соответствует определенное значение
выигрышей игроков
и
Поэтому
результаты игры можно описать в виде
двух матриц, определяющих выигрыши
игроков в зависимости от ситуации игры
в чистых стратегиях. Эти матрицы
называются платежными матрицами конечной
игры.
|
|
|
… |
|
|
|
|
… |
|
|
|
|
… |
|
… |
… |
… |
… |
… |
|
|
|
… |
|
|
|
|
… |
|
|
|
|
… |
|
|
|
|
… |
|
… |
… |
… |
… |
… |
|
|
|
… |
|
С точки зрения обоснования выбора стратегии игроков и оценки ожидаемых результатов игры информация, содержащаяся в платёжных матрицах, является эквивалентной описанным вышей строгим правилам игры, поэтому задание платежных матриц называют заданием игры с помощью платёжных матриц.