- •Особенности современной теории принятия решений.
- •Задача принятия решения.
- •Оценка операций по многим критериям.
- •Определение множества Парето Непрерывный случай.
- •Дискретный случай.
- •Методы условной оптимизации.
- •Динамическое программирование.
- •Принцип оптимальности Беллмана
- •Задача о наборе высоты и скорости летательного аппарата.
- •Функциональное уравнение Беллмана.
- •Задача распределения ресурсов.
- •Распределение по неоднородным этапам.
- •Распределение ресурсов между тремя и более отраслями.
- •Распределение ресурсов с резервированием.
- •Распределение ресурсов «с вложением доходов в производство».
- •Учёт предыстории процесса.
- •Задача с мультипликативным критерием.
- •Операции не связанные со временем.
- •Игровые модели принятия решений (теория игр).
- •Платёжная матрица.
- •Принцип минимакса.
- •Принцип чистых стратегий.
- •Смешанные стратегии. Решение игр в смешанных стратегиях.
- •Основная теорема теории игр.
- •Упрощение игр.
- •Решение игр .
- •Геометрическое решение игр .
- •Решение игр m n.
- •Теория принятия статистических решений.
- •Методы принятия решений в условиях риска. Принятие решений при известных априорных вероятностях.
- •Математическое ожидание
- •Принятие решений при неизвестной априорной информации.
- •Планирование эксперимента в условиях неопределённости.
- •Нет эксперимента:
- •Формула Байеса.
- •Многоэтапное принятие решений.
- •Задача о секретарше.
- •Нелинейное программирование (нлп).
- •Методы оптимизации нелинейных функций без ограничений.
- •Метод поиска минимальной, не использующий понятие производной. Метод Нелдера-Мида.
- •.Номер вершины.
- •Задачи нлп с ограничениями-равенствами.
- •Квадратичное программирование.
- •Решение задач квадратичного программирования методом Баранкина-Дорфмана.
- •Метод проекции градиента для решения задач нлп.
- •Методы возможных направлений Гаус-Зойтендейка.
- •– Ограничение нашей задачи
- •Методы экспертных оценок.
- •Типы задач оценивания.
- •– Дисперсия
- •Метод Делфи для численной оценки.
Платёжная матрица.
Р
ассмотрим
конечную игру в которой у игрока
стратегий, а у
.
Пусть при применении этих стратегий
известен выигрыш
,
тогда говорят, что задана платёжная
матрица. Т. е. применение в каждой игре
стратегии однозначно определяет исход
игры. Если есть случайные ходы, то выигрыш
так же случае, и можно взять математическое
ожидание выигрыша. Построить матрицу
можно не всегда из-за её большого размера
(игра в шахматы). Для игр с полной
информацией, т. е. когда один игрок знает,
как поступил второй, всегда можно
построить платёжную матрицу. Рассмотрим
простейшие примеры игр:
Игра поиск. Игрок
прячется в п
ервом
или втором месте. Игрок
ищет его. Если игрок
находит
,
то
платит ему один рубль, если же
не находит
,
то
платит один рубль
.
Построим платёжную матрицу.
Решение этой игры:
.
Игра три пальца. и
гроки
и
одновременно показывают один, два или
три пальца. Выигрыш равен сумме, причём
если получилось чётное число очков,
выигрывает
,
а если нечётное, то
.
Строим платёжную матрицу.
Решение у этой игры:
.
И
гра
вооружение – самолёты. У стороны
есть три вида вооружения: зенитка,
ракета и автомат. У
– три типа средств нападения. Известны
вероятности, с которыми каждый
ый
тип вооружения
сбивает каждое
ое
средство противника
.
Построим платёжную матрицу.
Решение для этой игры:
.
Такое решение называетсяседловой
точкой.
Рассмотрим принципы , на основе которых можно обосновать оптимальные решение.
Принцип минимакса.
Рассмотрим игру
.
При анализе игр применяют принцип
осторожности (пессимиста). Он требует,
чтобы мы больше всего реагировали на
плохие ходы со стороны противника
(плохие для нас).
Будем рассуждать со стороны игрока
:
если игрок
идет по
,
то мы просматриваем всю строку и фиксируем
самую меньшую
.
И так по всем строкам.
.
После этого мы можем выбрать
так, чтобы
было лучшее из худших:
–
нижняя цена игры (применяя принцип
минимакса, меньше величины
ты не получишь).
Теперь рассмотрим игру со стороны игрока
:
если игрок рассмотрит столбец
,
то самый худший для него – максимальный
в этом столбце.
.
Затем выбираем такую стратегию
,
которая обеспечивает минимум по
максимальным
:
верхняя
цена игры.
Итак, мы можем сразу найти
и
анализируя матрицы.
Принцип чистых стратегий.
Если игра имеет седловую точку, то говорят, что игра решается в чистых стратегиях. Такое решение обладает свойством устойчивости, т. е. если один игрок придерживается своей оптимальной стратегии, то другому игроку невыгодно отклоняться от своей оптимальной стратегии. Это свойство устойчивости полагается в основу понятия оптимальной игры. В игре может быть несколько седловых точек. Но как правило таких точек нет, и нельзя найти решение в чистых стратегиях.
Смешанные стратегии. Решение игр в смешанных стратегиях.
Если
,
то можно улучшить нашу нижнюю границу
путём смешивания чистых стратегий, т.
е. изменением стратегии от одной к другой
от одного этапа игры к другому. Для
каждой конкретной игры можно установить:
.
Здесь
цена
игры;
,
вероятность применения стратегии
;
,
вероятность
применения стратегии
.
– свойство полноты.
С применением смешанных стратегий
всегда можно найти решение, обладающее
устойчивостью. Решением игрыназывается пара оптимальных смешанных
стратегий
обладающих следующим свойством: если
один из игроков придерживается своей
оптимальной смешанной стратегии, то
другому не может быть выгодно отступать
от своей. Выигрыш соответствующего
оптимального решения называетсяценой
игры.
