- •Эволюция теории принятия решений
- •Функции полезности
- •Выработка решений в условиях определенности Принцип оптимальности. Задача принятия решений в условиях определенности
- •Однокритериальные задачи оптимизации
- •Многокритериальные задачи принятия решений
- •Способ абсолютной и относитльной уступки
- •Принцип последовательной уступки
- •Свертка локальных критериев
- •Способы нормализации локальных критериев
- •Пример многокритериальной задачи принятия решения
- •Критерии эффективност и их шкалы Критерий эффективности
- •Группа критериев оптимальности
- •Группа критериев адаптивности
- •Шкалы критериев эффективности.
- •Принятие решений в условиях неопределенности
- •Принятие решений с использованием критерия Лапласа
- •Принятие решений по критери Вальда
- •Критерий Севиджа
- •Принятие решений по критерию Гурвица
- •Принятие решений в условиях риска
- •Критерий ожидаемого значения результата
- •Принятие решения в условиях конфликта(элменты теории игр) Основные понятия теории игр
- •Нижняя и верхняя цена игры. Принцип минимакса
- •Вплоне определенные игры (игры с седловой точкой)
- •Игры не содержащие седловой точки. Смешанные стратегии
- •Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2
- •Решение игры в смешанных стратегиях графоаналитическим методом
- •Методы решения задач mxn.
- •Задача. Решить игру с платежной матрицей
- •Разработка вариантов решений и принятие решений с использованием теории массового обслуживания.
- •Понятие марковского случайного процесса
- •Потоки событий
- •Предельные вероятности системы. Уравнения Колмогорова
- •Вычисление вероятностей состояний как функций времени(в переходный период)
- •Потоки Пальма и Эрланга
- •Рассмотрим применение нормированного потока Эрланга для решения задачи теории массового обслуживания.
- •Процесс гибели и размножения
- •Многоканальная система массового обслуживания с ограниченной очередью
- •Циклические ветвящиеся процессы
- •Применение математического аппарата для параллельных конечных марковских цепей для оценки доставки сообщений в компьютерных сетях
- •Элементы статистической теории принятия решений
Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2
Если в платежной матрице игры не обнаруживается седловая точка, то из этого следует что игра имеет решение, но не в чистых, а смешанных стратегиях. При этом оптимальная стратегия S*А=<P*1,P*2>
S*B=<Q*1,Q*2>
P1,P2 – вероятности использования своих первой или второй чистой стратегий
Qi – вероятность применения игроком B своих чистых стратегий B1 или В2
Пусть платежная матрица такой игры задана:
P=
|
В1 |
В2 |
A1 |
a11 |
a12 |
A2 |
a21 |
a22 |
Где аij – элемент матрицы, определяющий выигрыш (проигрыш) игрока А(В) в случае если игрок А примет свою стратегию iую, в ответ на которую игрок В применяет свою jую чистую стратегию. Эта игра является парной, т.к. учавствуют только 2 игрока А и В.
И в то же время игрой 2х2, т.к. у А всего две стратегии и у В тоже 2е стратегии.
В теории игр принято считать, что стратегия игрока А указывается по строка платежной матрицы, а стратегии игрока В по столбцам.
Решение такой задачи начинается с проверки наличия в платежной матрице седловой точки. Если таковая существует, то решение игры однозначно и выражается в одной из чистых стратегий игроков А и В. В этом случае всегда выигрыш одного игрока равен проигрышу другого игрока цена игры находится на пересечении строки соответствующей нижней цене игры и столбца соответствующего верхней цене игры.
Если в платежной матрице не обнаруживается седловая точка, то оптимальной стратегией игрока А будет стратегия а1 или а2 применяющиеся соответственно с вероятностями P*1 P*2.
Тогда выигрыш игрока А будет определяться V=a11*P1+a21*P2
A1 |
A2 |
P*1 |
P*2 |
Такая зацпись соответствует применением игроком B стратегии В1.
Если игрок В примет стратегию В2, то цена выигрыша игрока А будет определяться ворым столбцом матрицы V=a12*P1+a22*P2
Учитывая, что стратегий всего 2е как у А так и у В и что никаких других вариантов не существует следовательно события применения той или другой стратегии составляют полную группу событий.
Для того чтобы получить искомые значения Р*1, P*2
Система уравнений
V=a11*P1+a21*P2 <- B1
V=a12*P1+a22*P2 <-B2
P1+P2=1
P2=(a11-a12)/ (a11+a22-a12-a21)
P1=1-P2
V=(a22*a11-a12*a21)/ (a11+a22-a12-a21)
Рассуждая аналогично и применяя теорему об активных стратегиях можно точно так же рассчитать оптимальные значения Q*1 и Q*2, но по столбцам
Q*1=(a22-a12)/(a11+a22-a12-a21)
Q2=1-Q1
Задача
Поиск
Игрок А имеет возможность спрятаться в одном из убежишь I или II.
Игрок В отыскивает игрока в одном из убежишь I или II
Если игрок В отыскал игрока А, то игрок А выплачивает игроку В штраф в одну денежную единицу. Если же игрок В не отыскал игрока А, то игрок В выплачивает одну денежную единицу.
Требуется получить решение игры.
Решение:
Сформулируем стратегии игроков.
Стратегия а1 – игрок А спрятался в убежище 1
Стратегия а2 – игрок А спрятался в убежище 2
Стратегия b1 –игрок В ищет в убежище 1
Стратегия b2 – игрок В ищет в убежище 2
Тогда если игрок А принял стратегия А1 и игрок В принял стратегию В1, то игрок В обнаруживает игрока А в убежище 1 и игрок А должен выплатить игроку В штраф в 1 денежную едиицу. Значит элемент платежной матрица а11 равен -1.
Если А ->a2 and B->b2 значит а22=-1
Если A->a1 and B->b2 значит a12=1
P=
-
-1
1
1
-1
Седловой точки не имеет альфа=-1, бетта=1
Таким образом оптимальная стратегия игрока А выбирать убежище 1 или 2 с вероятностью 0,5, а оптимальная стратегия В искать или в первом или во втором 0,5
Р1=(a22-a21)/(a11+a22-a12-a21)
P2=1-P1=0.5