
- •Тема 1. Предмет и задачи курса «Теория принятия решений»
- •1. Что такое теория принятия решений?
- •2. Значение теории принятия решении
- •3. Круг задач, стоящих перед теорией принятия решений
- •4. История развития теории принятия решений
- •5. Методологические основы теории принятия решений
- •6. Будущее теории принятия решений
- •Тема 2. Основные элементы процесса принятия решений.
- •Люди, принимающие решения
- •2. Люди и их роли в процессе принятия решений (ппр)
- •3.Альтернативы
- •4. Критерии
- •5. Оценки по критериям
- •Тема 3. Процесс принятия решений и его этапы.
- •1.Процесс принятия решений (ппр).
- •2.Множество Эджворта – Парето.
- •3. Типовые задачи принятия решений.
- •4. Многодисциплинарный характер науки о принятии решений.
- •Тема 4. Аксиоматические теории рационального поведения.
- •1.Рациональный выбор в экономике.
- •Аксиомы рационального поведения.
- •3. Деревья решений
- •4. Парадокс Алле
- •5. Нерациональное поведение. Эвристики.
- •3. Суждение по точке отсчета.
- •4. Сверхдоверие.
- •5. Стремление к исключению риска.
- •6.Объяснения отклонений от рационального поведения.
- •7. Теория проспектов.
- •Тема 5. Принятие решений в условиях риска и неопределенности
- •1. Принятие решений в условиях риска
- •Принятие решений в условиях неопределенности
- •3. Игровые методы обоснования решений
- •2.1. Платежная матрица
- •2.2. Нижняя и верхняя цена игры. Принцип минимакса
- •4. Методы коллективной экспертной оценки. Коллективная генерация идей. Дельфийский метод.
- •Тема 6. Многокритериальные решения при объективных моделях.
- •Многокритериальность
- •Разные типы проблем
- •4.Многокритериальные модели принятия решений в условиях определенности.
- •5. Методы многокритериальной оптимизации.
- •Методы многокритериального выбора на основе дополнительной информации
- •Тема 7. Оценка многокритериальных альтернатив: многокритериальная теория полезности
- •1. Снова об этапах процесса принятия решений
- •2. Различные группы задач принятия решений
2.2. Нижняя и верхняя цена игры. Принцип минимакса
Рассмотрим некоторую игру, определяемую нижеприведенной платежной матрицей, и рассмотрим случай использования в этой игре «чистых» стратегий.
-
В1
В2
...
Вn
A1
a11
а12
а1n
A2
а21
а22
а2n
...
Am
am1
аm2
аmn
Дополним платежную матрицу столбцом с элементами 1, 2, …, m, где i = min ij (минимизация по j) и строкой с элементами 1, 2, …, n,
где j = max ij.минимизация по i ).
= max i или = max min ij - нижняя цена игры - так называемый максимин.
Оказывается, что при любом поведении игрока В игрок А имеет выигрыш не меньший, чем . Таким образом это оценка снизу для результата игры игрока А, если в игре используются «чистые» стратегии.
Аналогичные рассуждения можно провести для игрока В и ввести
= min j или = min max ij - называют минимакс или верхняя цена игры. Придерживаясь «чистой» стратегии, соответствующей минимаксу, игрок В может быть уверен, что проиграет не больше .
Принцип, определяющий игрокам выбор максиминной и минимаксной стратегий, называется принципом минимакса.
Рассмотрим игру, характеризующуюся «платежной матрицей»:
|
В1
|
В2
|
ВЗ
|
|
А1
|
2
|
-3
|
4
|
-3
|
А2
|
-3
|
4
|
-5
|
-5
|
A3
|
4
|
-5
|
6
|
-5
|
|
4
|
4
|
6
|
|
Для этой игры = -3, = 4.
Максиминная стратегия игрока А гарантирует, что игрок А проиграет не более 3 руб., минимаксная стратегия игрока В гарантирует, что он проиграет не больше 4 руб.
Для рассматриваемой игры минимаксные стратегии неустойчивы.
Действительно, пусть Игрок В выбрал стратегию В1, тогда, поняв это, игрок А выберет A3 и будет выигрывать 4 руб. На это игрок В может ответить стратегией В2 и будет выигрывать 5 руб. На это игрок А ответит стратегией А2 и будет выигрывать 4 руб. и т.д.
В нашем случае соответствующие минимаксные стратегии игроков неустойчивы, и могут быть изменены после поступления информации о поведении противника.
Однако, существуют игры, для которых значения максимина и минимакса совпадают. При этом минимаксные стратегии игроков А и В («чистые стратегии») являются устойчивыми стратегиями.
В платежной матрице такой игры имеется элемент, который является одновременно минимальным в своей строке и максимальным в соответствующем столбце. Такой элемент называют «седловой точкой», а соответствующую игру - игрой с «седловой точкой».
Для игры с «седловой точкой» минимаксные стратегии игроков А и В являются оптимальными стратегиями, т.е. если один игрок придерживается своей минимаксной стратегии, то для другого игрока не может быть выгодным отклоняться от своей минимаксной стратегии.
Для игры с «седловой точкой» минимаксные стратегии обладают устойчивостью.
Одним из фундаментальных результатов «Теории игр» является доказательство факта, что «игры с полной информацией» являются играми с «седловой точкой» (к таким играм относятся, например, шашки, шахматы, крестики-нолики и т.д.).
«Игры с полной информацией» - это игры, в которых каждый игрок при каждом личном ходе знает результаты всех предыдущих ходов - как личных, так и случайных. Таким образом, доказано, что любая «игра с полной информацией» имеет «седловую точку» и, следовательно, оптимальное решение в «чистых стратегиях». Это сильный результат, если учитывать, что класс игр с полной информацией достаточно велик.
Другим интересным фундаментальным результатом «Теории игр» является утверждение, что для каждой «конечной игры» можно в классе «смешанных стратегий» найти пару устойчивых оптимальных стратегий для игроков А и В, обладающих свойством -если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей (здесь оптимальные стратегии смешанные).
Рассмотренный материал из «Теории игр» является очень кратким введением, позволяющим почувствовать специфику задач этого раздела математики, получить представление об используемом аппарате и сложности задач данной области.