- •Основные понятия теории игр
- •Классификация игр
- •Описание игры в развернутой форме
- •Бескоалиционные игры
- •Приемлемые ситуации и ситуации равновесия в игре
- •Стратегическая эквивалентность игр
- •Антагонистические игры. Общие сведения
- •Чистые и смешанные стратегии
- •Верхняя и нижняя цены игры при использовании смешанных стратегий
- •Основная теорема антагонистических игр.
- •Верхние и нижние цены в s-игре
- •Разделительная и опорная гиперплоскость двух выпуклых множеств
- •Теорема о минимаксе
- •Геометрическая интерпретация минимакса
- •Решение антагонистических игр. Доминирующие и полезные стратегии
- •Игры с частными случаями платежных матриц
- •Решение матричных игр
- •Линейное программирование для решения матричных игр
- •Графическое решение игр 2*n и m*2
- •Бесконечные антагонистические игры
- •Строго выпуклые игры на единичном квадрате
- •Неантагонистические игры
- •Бескоалиционные игры
- •Охрана воздушного бассейна от загрязнений атмосферы
- •Принципы оптимальности в бескоалиционных играх
- •Принцип оптимальности по Парето
- •Смешанное расширение бескоалиционной игры
- •Коалиционные и кооперативные игры
- •Характеристическая функция коалиционной игры
- •Свойства характеристической функции
- •Дележи в кооперативной игре
- •Стратегическая эквивалентность кооперативных игр
- •Общие сведения об играх с природой или теория статистических решений.
- •Пространство стратегий природы
- •Пространство стратегий статистика и функция выигрыша
- •Критерии выбора решений при неопределённости
- •Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- •Допустимые стратегии в статистических играх
- •Геометрическая интерпретация выбора байесовской стратегии
- •Статистические игры с проведением единичного эксперимента Общие сведения
- •Пространство выборок
- •Функции риска
- •Принцип выбора стратегий в играх с единичным экспериментом.
- •Байесовский принцип.
- •Число чистых стратегий статистика в игре с единичным экспериментом.
- •Апостериорные распределения вероятности.
- •Определение байесовских решений с использованием апостериорных вероятностей
- •Двуальтернативная задача
- •Анализ целесообразности проведения экспериментов
- •Использование апостериорной вероятности для определения последовательных байесовских правил
- •Правило последовательных выборок
- •Функция риска при оптимальном последовательном правиле
Анализ целесообразности проведения экспериментов
Пусть в результате
проведения единичного эксперимента
может появиться k
исходов:
.
Предположим, что имеются вероятности
.
Множество состояний природы:
.
Обозначим
— вероятность появления исхода
эксперимента
при состоянии природы
.
.
Ясно, что для
каждого j:
.
Считаем, что матрица
W
известна статистику. Кроме этого известна
матрица выигрышей
,
которая получена статистиком, используя
стратегию
в
состоянии природы
.
Статистику известна стоимость проведения единичного эксперимента – с.
Анализируя эту информацию, статистик должен дать ответы на два вопроса:
Целесообразно или нет проведение эксперимента.
Какую из решающих функций необходимо при этом использовать, если эксперимент будет проводиться.
Рассмотрим обоснования для оценки ответа на первый вопрос.
Пусть в результате
эксперимента произошел некоторый исход
.
Апостериорные вероятности состояния
природы
обозначим в виде
.
Эти вероятности определяют некоторую
матрицу
,
которую можно определить через
апостериорные вероятности
по формуле Байеса:
.
С помощью
апостериорных вероятностей для каждой
из чистых стратегий статистика
можно определить условно средний выигрыш
Оптимальную
стратегию
.
Величины
являются случайными величинами,
вероятность их появления совпадает с
вероятностью исхода эксперимента.
Обозначим через
вероятность l-ого
исхода эксперимента. Она будет определяться
вероятностью исхода при всех состояниях
природы:
Тогда дополнительный выигрыш, который можно получить при проведении единичного эксперимента определяется следующим образом:
.
Если
,
то эксперимент проводить стоит, если
же наоборот, то не стоит.
Статистические игры с последовательными выборками
Общие сведения
При рассмотрении
игры с единичным экспериментом эксперимент
может состоять либо из одного опыта,
либо из последовательности опытов с
оговоренным их числом. Результаты
каждого опыта можно представить в виде:
-
последовательность результатов опытов.
Эту последовательность можно рассматривать
как выборку заданного объема N.
Поэтому игру с единичным экспериментом
называют игрой с заданным объемом
выборки.
Решение в такой игре принимается после осуществления всех N испытаний. Однако статистик может принимать решения, основываясь не на всех N опытах, а на некоторой их части.
После каждого опыта статистику приходится решать вопросы:
- продолжать эксперимент, добавляя число опытов;
- закончить дальнейшее проведение опыта и принять решение.
Эта дилемма расширяет план возможных стратегий статистика, так как к его чистым стратегиям добавляются новые стратегии о продолжении эксперимента. Такие игры называются играми с последовательными выборками.
В общем случае последовательные выборки не обязательно предполагают их конечность. Для подчеркивания того факта, что имеют дело с ограниченным объемом выборки, игры называют играми с усеченными последовательными выборками.
Ниже будем рассматривать такие игры.
Отдельные результаты опытов будем называть наблюдениями.
Если бы проведение всех опытов ничего не стоило, то статистик ничего бы не потерял, проведя все N опытов. Однако каждый из опытов стоит времени и материальных затрат. Естественно, что статистик на каждой стадии общего эксперимента должен сопоставлять стоимость получения дополнительных наблюдений с выигрышем от полученной дополнительной информации.
Рассмотрим далее способ описания игры с усеченными последовательными выборками.
Пусть j — номер опыта, j=1,2,…N.
— множество исходов
этого опыта. Тогда полное пространство
Y
— множество всевозможных исходов опытов
.
В игре с
последовательными выборками допускается
принятие решения на основе первых j
наблюдений:
— исходы j
опытов.
В связи с таким
подходом полное множество У можно
разбить на непересекающиеся подмножества
таких, что если
то
решение принимается на основании
наблюдений
.
Тогда полное множество
называется
планом последовательной выборки.
Множество Y
можно разбить на непересекающиеся
множества
несколькими различными способами.
Каждый способ разбиения дает свой план
выборки.
Множество всевозможных планов последовательной выборки обозначим через J и назовем полным планом последовательной выборки.
Для принятия решения статистик должен выработать решающую функцию x=d(y), определяющую решения для каждой последовательности наблюдений.
D — множество всевозможных решающих функций, каждую функцию статистик выбирает из множества D как и в игре с единичным экспериментом.
Таким образом, стратегия статистика в данной игре состоит из следующих этапов:
Выбор плана последовательной выборки
,
показывающий, когда должен быть прекращен
эксперимент;Выбор решающей функции d(y) из множества D, указывающей какое решение x надо выбрать после прекращения эксперимента.
