- •Основные понятия теории игр
- •Классификация игр
- •Описание игры в развернутой форме
- •Бескоалиционные игры
- •Приемлемые ситуации и ситуации равновесия в игре
- •Стратегическая эквивалентность игр
- •Антагонистические игры. Общие сведения
- •Чистые и смешанные стратегии
- •Верхняя и нижняя цены игры при использовании смешанных стратегий
- •Основная теорема антагонистических игр.
- •Верхние и нижние цены в s-игре
- •Разделительная и опорная гиперплоскость двух выпуклых множеств
- •Теорема о минимаксе
- •Геометрическая интерпретация минимакса
- •Решение антагонистических игр. Доминирующие и полезные стратегии
- •Игры с частными случаями платежных матриц
- •Решение матричных игр
- •Линейное программирование для решения матричных игр
- •Графическое решение игр 2*n и m*2
- •Бесконечные антагонистические игры
- •Строго выпуклые игры на единичном квадрате
- •Неантагонистические игры
- •Бескоалиционные игры
- •Охрана воздушного бассейна от загрязнений атмосферы
- •Принципы оптимальности в бескоалиционных играх
- •Принцип оптимальности по Парето
- •Смешанное расширение бескоалиционной игры
- •Коалиционные и кооперативные игры
- •Характеристическая функция коалиционной игры
- •Свойства характеристической функции
- •Дележи в кооперативной игре
- •Стратегическая эквивалентность кооперативных игр
- •Общие сведения об играх с природой или теория статистических решений.
- •Пространство стратегий природы
- •Пространство стратегий статистика и функция выигрыша
- •Критерии выбора решений при неопределённости
- •Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- •Допустимые стратегии в статистических играх
- •Геометрическая интерпретация выбора байесовской стратегии
- •Статистические игры с проведением единичного эксперимента Общие сведения
- •Пространство выборок
- •Функции риска
- •Принцип выбора стратегий в играх с единичным экспериментом.
- •Байесовский принцип.
- •Число чистых стратегий статистика в игре с единичным экспериментом.
- •Апостериорные распределения вероятности.
- •Определение байесовских решений с использованием апостериорных вероятностей
- •Двуальтернативная задача
- •Анализ целесообразности проведения экспериментов
- •Использование апостериорной вероятности для определения последовательных байесовских правил
- •Правило последовательных выборок
- •Функция риска при оптимальном последовательном правиле
Определение байесовских решений с использованием апостериорных вероятностей
Если в результате проведения единичного эксперимента произошел конкретный исход , то, по-видимому, для этого исхода и следует решать задачу по выбору решения. Это можно проделать, посчитав апостериорные вероятности состояния природы z при исходе y: .
При этом известно, что Z — множество состояний природы, X — возможные решения. Такая задача отличается от задачи без эксперимента тем, что вместо апостериорных вероятностей природы используются априорные вероятности, то есть .
Используя аналогию этой задачи можно определить средние значения потерь статистика: .
Байесовский принцип выбора стратегий сводится к тому, чтобы выбрать такое , при котором .
Рассмотрим байесовский принцип на примере двуальтернативной задачи:
Двуальтернативная задача
Пусть .
Будем считать, что при правильном выборе решения , потери статистика отсутствуют (или равны 0).
Тогда ошибка первого рода дает потери 1, а ошибка второго рода дает потери w.
Данная задача описывается матрицей потерь:
z |
|
|
|
0 |
w |
|
1 |
0 |
Рассмотрим решающую функцию x=d(y), которая делит пространство Y — множество исходов эксперимента на 2 подмножества: S и C(S): , где C(S) — дополнение S до Y.
Если , то принимается решение ;
Если , то принимается решение .
Так как множества S и C(S) должна быть компактными, необходимо найти границу этого подмножества. Обозначим через — элементы, принадлежащие этой границе. Очевидно, что если множество исходов эксперимента можно описать в виде прямой, то — это точка на этой прямой. На плоскости — это линия.
Для нахождения уравнения определяем границу . Рассмотрим выражение для средних потерь. Учитывая данные, приведенные в таблице, потери будут определяться:
.
В общем случае потери .
Граница соответствует одинаковым потерям при решении и . Для рассматриваемой задачи уравнение, определяющее границу, определяется как:
.
Отношение правдоподобия в этом случае:
.
Из этого условия следует, что каждому значению q будет соответствовать своя граница и соответственно области S и C(S). Аналогично вероятности ошибочных решений и будут определяться априорной вероятностью q. — вероятность ошибки первого рода; - вероятность ошибки второго рода. Эти вероятности показывают вероятность того, что при , а при
Тогда более развернуто:
Для определения характера зависимости вероятностей ошибочных решений от q, сначала оцениваются крайние значения q=0 и q=1. Если , то принимается решение , которое предполагает, что потери . Выражая эти потери, можно получить, что
Предположим, что q=0. Это предполагает, что отношение .
Это может быть только в том случае, если: , C(S)=Y. Если посчитать значения коэффициентов =1, С(S)=Y.
В другом крайнем состоянии q=1, получаем:
. Это может быть, когда .
Это условие определяет, что множество исходов эксперимента Y=S, C(S)= Таким образом, вероятности ошибок при изменении .
Определим средние потери при любом значении как байесовские риски:
Если рассмотреть график зависимости , то он будет иметь вид вогнутой кривой:
На практике встречаются случаи, когда значение q неизвестно, а известна его оценка . Возникает вопрос: «Как поступить?».
При приближенной оценке получим :
Если — грубая оценка, то потери могут стать больше максимальных потерь при , то есть
При значимом отличие q от , потери невыгодны и в этом случае удобнее исходить из наиболее неблагоприятного . Ориентированные на потери можно рассматривать как минимаксные потери, стратегию как минимаксную стратегию. Применение байесовских принципов оправдано, когда q хорошая оценка , а при плохих оценках используется минимаксный принцип выбора стратегий.