Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metodichka_SPPRLR240408.doc
Скачиваний:
39
Добавлен:
09.11.2019
Размер:
4.54 Mб
Скачать

Игры с природой с экспериментами.

Рассмотренные выше игры с природой предусматривали необходимость принятия нами решения в условиях неопределенности на основе имеющихся у нас данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов. Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами.

Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а мы можем только делать вывод о целесообразности его проведения на основании имеющейся априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки конечен и известен заранее.

Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания мы можем принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте), или быть неограниченным (неограниченный последовательный эксперимент).

Будем считать, что в нашем распоряжении имеется набор стратегий , которые он может использовать в ответ на одну из возможных стратегий природы , появляющуюся с вероятностью при условии

.

Известна также платежная матрица . Для снижения неопределенности относительно действительного состояния природы мы можем провести эксперимент, стоимость которого известна и равна . Пусть в результате проведения эксперимента состояние природы станет известно точно. Необходимо сделать вывод о целесообразности проведения эксперимента.

Наш средний выигрыш при использовании стратегии может быть определен как

. (9)

В качестве оптимальной стратегии может быть выбрана стратегия , максимизирующая наш средний выигрыш

.

Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы . Очевидно, что в этом случае мы должны выбирать стратегию, обеспечивающую наш максимальный выигрыш

. (10)

Оценим теперь средний возможный выигрыш после проведения эксперимента

где ‑ стоимость проведения эксперимента. Отсюда появляется условие целесообразности проведения эксперимента

или

.

Преобразовывая неравенство, имеем

. (11)

Выражение в круглых скобках есть ничто иное как риск

.

Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной следует выбрать стратегию максимизирующую средний выигрыш или минимизирующую средний риск.

Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из несовместимых событий , связанных определенными вероятностями с состояниями (стратегиями) природы. Обозначим условную вероятность появления исхода эксперимента при условии стратегии природы символом . Поскольку образуют полную систему событий, справедливо

.

Будем считать, что все значения известны, а также известна стоимость проведения эксперимента . Нас по прежнему будет интересовать вопрос: целесообразно ли проведение эксперимента и если да, то какую стратегию необходимо выбрать при том или ином исходе эксперимента. Предположим, что в результате эксперимента был получен результат . Определим апостериорные вероятности стратегий природы по теореме Байеса [6]

.

Далее для каждой стратегии рассчитаем величину условного среднего выигрыша при условии результата эксперимента

.

Очевидно, что оптимальной будет стратегия , обеспечивающая максимум условного среднего выигрыша при конкретном исходе эксперимента

.

Вероятность появления условного выигрыша совпадает с вероятностью появления события . Обозначим ее символом . Тогда

.

Величина выигрыша с использованием эксперимента

.

С другой стороны наш выигрыш без проведения эксперимента определяется выражением

.

Отсюда вытекает условие целесообразности проведения эксперимента

Если проведение эксперимента признано целесообразным, то необходимо разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию необходимо выбрать, если эксперимент дал результат ?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]