- •Основные понятия теории игр
- •Классификация игр
- •Описание игры в развернутой форме
- •Бескоалиционные игры
- •Приемлемые ситуации и ситуации равновесия в игре
- •Стратегическая эквивалентность игр
- •Антагонистические игры. Общие сведения
- •Чистые и смешанные стратегии
- •Верхняя и нижняя цены игры при использовании смешанных стратегий
- •Основная теорема антагонистических игр.
- •Верхние и нижние цены в s-игре
- •Разделительная и опорная гиперплоскость двух выпуклых множеств
- •Теорема о минимаксе
- •Геометрическая интерпретация минимакса
- •Решение антагонистических игр. Доминирующие и полезные стратегии
- •Игры с частными случаями платежных матриц
- •Решение матричных игр
- •Линейное программирование для решения матричных игр
- •Графическое решение игр 2*n и m*2
- •Бесконечные антагонистические игры
- •Строго выпуклые игры на единичном квадрате
- •Неантагонистические игры
- •Бескоалиционные игры
- •Охрана воздушного бассейна от загрязнений атмосферы
- •Принципы оптимальности в бескоалиционных играх
- •Принцип оптимальности по Парето
- •Смешанное расширение бескоалиционной игры
- •Коалиционные и кооперативные игры
- •Характеристическая функция коалиционной игры
- •Свойства характеристической функции
- •Дележи в кооперативной игре
- •Стратегическая эквивалентность кооперативных игр
- •Общие сведения об играх с природой или теория статистических решений.
- •Пространство стратегий природы
- •Пространство стратегий статистика и функция выигрыша
- •Критерии выбора решений при неопределённости
- •Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- •Допустимые стратегии в статистических играх
- •Геометрическая интерпретация выбора байесовской стратегии
- •Статистические игры с проведением единичного эксперимента Общие сведения
- •Пространство выборок
- •Функции риска
- •Принцип выбора стратегий в играх с единичным экспериментом.
- •Байесовский принцип.
- •Число чистых стратегий статистика в игре с единичным экспериментом.
- •Апостериорные распределения вероятности.
- •Определение байесовских решений с использованием апостериорных вероятностей
- •Двуальтернативная задача
- •Анализ целесообразности проведения экспериментов
- •Использование апостериорной вероятности для определения последовательных байесовских правил
- •Правило последовательных выборок
- •Функция риска при оптимальном последовательном правиле
Определение байесовских решений с использованием апостериорных вероятностей
Если в результате
проведения единичного эксперимента
произошел конкретный исход
,
то, по-видимому, для этого исхода и
следует решать задачу по выбору решения.
Это можно проделать, посчитав апостериорные
вероятности состояния природы z
при исходе y:
.
При этом известно,
что Z
— множество состояний природы, X
— возможные решения. Такая задача
отличается от задачи без эксперимента
тем, что вместо апостериорных вероятностей
природы используются априорные
вероятности, то есть
.
Используя аналогию
этой задачи можно определить средние
значения потерь статистика:
.
Байесовский принцип
выбора стратегий сводится к тому, чтобы
выбрать такое
,
при котором
.
Рассмотрим байесовский принцип на примере двуальтернативной задачи:
Двуальтернативная задача
Пусть
.
Будем считать, что
при правильном выборе решения
,
потери статистика отсутствуют (или
равны 0).
Тогда ошибка первого рода дает потери 1, а ошибка второго рода дает потери w.
Данная задача описывается матрицей потерь:
z |
|
|
|
0 |
w |
|
1 |
0 |
Рассмотрим решающую
функцию x=d(y),
которая делит пространство Y
— множество исходов эксперимента на 2
подмножества: S
и C(S):
,
где C(S)
— дополнение S
до Y.
Если
,
то принимается решение
;
Если
,
то принимается решение
.
Так как множества
S
и C(S)
должна быть компактными, необходимо
найти границу этого подмножества.
Обозначим через
— элементы, принадлежащие этой границе.
Очевидно, что если множество исходов
эксперимента можно описать в виде
прямой, то
— это точка на этой прямой. На плоскости
— это линия.
Для нахождения уравнения определяем границу . Рассмотрим выражение для средних потерь. Учитывая данные, приведенные в таблице, потери будут определяться:
.
В общем случае
потери
.
Граница соответствует одинаковым потерям при решении и . Для рассматриваемой задачи уравнение, определяющее границу, определяется как:
.
Отношение правдоподобия в этом случае:
.
Из этого условия
следует, что каждому значению q
будет соответствовать своя граница
и соответственно области S
и C(S).
Аналогично вероятности ошибочных
решений
и
будут определяться априорной вероятностью
q.
— вероятность ошибки первого рода;
-
вероятность ошибки второго рода. Эти
вероятности показывают вероятность
того, что при
,
а при
Тогда более развернуто:
Для определения
характера зависимости вероятностей
ошибочных решений от q,
сначала оцениваются крайние значения
q=0
и q=1.
Если
,
то принимается решение
,
которое предполагает, что потери
.
Выражая эти потери, можно получить, что
Предположим, что
q=0.
Это предполагает, что отношение
.
Это может быть
только в том случае, если:
,
C(S)=Y.
Если посчитать значения коэффициентов
=1,
С(S)=Y.
В другом крайнем состоянии q=1, получаем:
.
Это может быть, когда
.
Это условие
определяет, что множество исходов
эксперимента Y=S,
C(S)=
Таким образом, вероятности ошибок при
изменении
.
Определим средние
потери при любом значении
как байесовские риски:
Если рассмотреть
график зависимости
,
то он будет иметь вид вогнутой кривой:
На практике
встречаются случаи, когда значение q
неизвестно, а известна его оценка
.
Возникает вопрос: «Как поступить?».
При приближенной
оценке получим
:
Если
— грубая оценка, то потери
могут
стать больше максимальных потерь при
,
то есть
При значимом
отличие q
от
,
потери
невыгодны и в этом случае удобнее
исходить из наиболее неблагоприятного
.
Ориентированные на потери
можно
рассматривать как минимаксные потери,
стратегию
как минимаксную стратегию. Применение
байесовских принципов оправдано, когда
q
хорошая оценка
,
а при плохих оценках используется
минимаксный принцип выбора стратегий.
