- •Оглавление
- •Постановка задачи.
- •Формализация задачи.
- •Нахождение метода решения.
- •Проверка и корректировка модели.
- •Типичные классы задач исследования операций
- •Некоторые принципы принятия решений в ио
- •Многокритериальные задачи принятия решений в условиях определенности
- •Методика определения полезности для ситуации с качественными критериями
- •Принятие решений в условиях риска
- •Принятие решений в условиях неопределенности
- •Критерии Вальда, Лапласа, Гурвица, Сэвиджа в частном случае принятия решений в условиях неопределенности
- •Принятие решений в условиях конфликтных ситуаций или противодействия.
- •Развернутая форма игры
- •Нормальная форма игры
- •Ситуации равновесия
- •Игры с нулевой суммой. Антагонистические игры. Теорема о ситуациях равновесия.
- •Доказательство. Ситуация равновесна. Следовательно . Т.Е. Выбор любой другой стратегии первым игроком, при условии, что второй сохранит стратегию , приводит к худшему результату.
- •Нормальная форма
- •Смешанные стратегии. Максиминные и минимаксные стратегии игроков.
- •Теорема о минимаксе. Лемма 1 (об опорной гиперплоскости).
- •Поэтому
- •Теорема о минимаксе. Лемма 2.
- •Доказательство теоремы о минимаксе
- •Вычисление оптимальных стратегий (поиск решения в чистых стратегиях, доминирование стратегий, решение игр 22).
- •Решение антагонистических игр методами линейного программирования.
- •Решение методами линейного программирования матричных игр с ограничениями.
- •Решение параметрических задач линейного программирования.
- •Таким образом, можно утверждать, что если , (4)
- •Методы отсечения для решения задач дискретного программирования.
- •Первый алгоритм Гомори для решения полностью целочисленной задачи линейного программирования
- •Блок‑схема алгоритма
- •Второй алгоритм Гомори для решения частично целочисленной задачи линейного программирования
- •Третий алгоритм Гомори (полностью целочисленный)
- •Построение целочисленного правильного отсечения для 3-го алгоритма Гомори.
- •Построение начальной l-нормальной целочисленной симплексной таблицы
- •Построение целочисленного отсечения в третьем алгоритме Гомори
- •Выбор в третьем алгоритме Гомори
- •Метод потенциалов для решения транспортной задачи с ограничениями на пропускные способности
- •Решение задач нелинейного программирования с ограничениями равенствами. Метод множителей Лагранжа
- •Метод множителей Лагранжа
- •Условия Куна-Таккера для задачи выпуклого нелинейного программирования
- •Квадратичное программирование
- •Метод Франка и Вулфа для задачи квадратичного программирования
- •Исходная таблица метода Франка и Вулфа
- •Метод Баранкина и Дорфмана для задачи квадратичного программирования
- •Алгоритм
- •Исходная таблица метода Баранкина-Дорфмана
Нормальная форма игры
В интуитивном понимании стратегия есть некоторый план развертывания игры.
Определение. Стратегия i-го игрока есть некоторая функция, которая ставит в соответствие каждому информационному множеству этого игрока некоторый индекс из .
Будем
обозначать множество всех стратегий
i-го игрока через
.
Вообще говоря, игрок принимает решение
о своем ходе в игре обычно в тот момент,
когда надо делать этот ход. Однако с
чисто теоретической точки зрения можно
абстрагироваться от такого практического
ограничения и предполагать, что уже до
начала игры каждый игрок решил, что он
будет делать в каждом случае. Т.е.
предполагаем, что каждый игрок выбрал
некоторую стратегию уже до начала игры.
Поскольку это так, то остается лишь произвести случайные ходы. Более того, все случайные ходы можно объединить в один ход, результат которого вместе с выбранными стратегиями определяет исход игры.
Нас, как и игроков, интересует, какие из стратегий являются наилучшими с точки зрения максимизации доли каждого игрока в выигрыше: i-ый игрок стремится максимизировать i-ю компоненту функции выигрыша.
Т.к., однако,
результаты случайных ходов известны
только в вероятностном смысле, то
естественно рассматривать математическое
ожидание функции выигрыша, определенное
в случае, когда игроки используют данный
n-набор
стратегий, т.е данную ситуацию.
Поэтому для описания математического
ожидания функции выигрыша при условии,
что i-ый
игрок применяет стратегию
,
можно использовать следующее обозначение:
Функцию
на множестве всех взаимных значений
,
…,
можно выразить либо в форме соотношения,
либо в виде n-
мерной таблицы n-мерных
векторов. В случае n=2
эта запись сводится к матрице, элементами
которой являются пары вещественных
чисел. Такая n-мерная
таблица называется нормальной
формой игры.
Пример0. Для игры в “Орлянку” нормальной формой игры является матрица
|
“Р” |
“О” |
Р” |
(−1, 1) |
(1, −1) |
О” |
(1, −1) |
(−1, 1) |
Здесь каждая строка представляет стратегию игрока 1, а столбец − стратегию игрока 2.
Пример0.
Рассмотрим следующую игру. Случайно
выбирается целое число z
с возможными значениями 1, 2, 3, 4, каждое
с вероятностью
.
Игрок I
не зная результата этого хода, выбирает
целое число x.
Игрок II,
не зная ни z,
ни х,
выбирает целое число у.
Выигрыш определяется
следующим образом:
,
т.е. целью является выбор числа, по
возможности близкого к z.
В этой игре каждый
игрок имеет 4 стратегии: 1, 2, 3, 4, так как
от других чисел мало проку. Если игрок
I
выбирает 1, а, игрок II
− 3, то
выигрыш будет равен (2, -2) с вероятностью
,
(0,0) - с вероятностью
и (-2, 2) с вероятностью
.
Ожидаемый выигрыш тогда равен:
.
Подсчитав все значения, получим таблицу:
-
1
2
3
4
1
(0, 0)
(−1/2, 1/2)
(−1/2, 1/2)
(0, 0)
2
(1/2, −1/2)
(0, 0)
(0, 0)
(1/2, −1/2)
3
(1/2, −1/2)
(0, 0)
(0, 0)
(1/2, −1/2)
4
(0, 0)
(−1/2, 1/2)
(−1/2, 1/2)
(0, 0)
Определение. Игра называется конечной, если число стратегий всех игроков является конечным. Или. Игра называется конечной, если ее дерево содержит только конечное число вершин.
