Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Саратовский Государственный Технический Университет им. Ю.А. Гагарина

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Миргородская 7сессия / Методы оптимизации / Лекции / Лекция 5.doc

Скачиваний:

Добавлен:

12.02.2015

Размер:

3.41 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 77

Статистическая игра с единичным экспериментом

Идеальный эксперимент такой, что однозначно выявляет состояние природы.

Рассмотрим случай идеального эксперимента.

Оперирующая сторона называется статистиком.

Пусть статистик имеет стратегии : ,а природа может находиться в состояниях: с вероятностями наступления:.

- тот выигрыш, который получает статистик, если он выберет i стратегию, а природа будет в состоянии j.

Если мы не будем проводить эксперимент:

Предположим, что мы провели эксперимент и получилось так, что природа оказалась в состоянии П_i, следовательно, в матрице выигрышей мы выберем такую стратегию, для которой в j столбце стоит максимальное число: .

Мы не можем знать, какое состояние природы выпадет, поэтому величину надо усреднить по вероятностям наступления соответствующих состоянийq_j:

Необходимо сравнить с величиной, на которую мы сможем рассчитывать в случае не проведения эксперимента:

а_ср< β-С,

где С – стоимость проведения эксперимента. Если это условие выполняется, то эксперимент надо проводить.

Последнее условие равносильно условию:

(*)

Т.е. средний риск должен быть больше цены эксперимента.

Пример.

На технологическую линию может поступать сырье разного качества. Из прошлого опыта в 60% случаев сырье содержи малое количество примесей, а в 40% большое количество примесей. На линии имеется 3 режима работы (x₁,x₂,x₃). Прибыль предприятия от реализации продукта зависит как от наличия примесей, так и от стратегии (режима) согласно следующей таблице:

x П	П₁	П₂
x₁	5	1
x₂	4	2
x₃	2	3

Вероятности состояний природы:

q₁=0.6; q₂=0.4.

Матрица риска и средних условных рисков имеет вид

Таким образом, если цена эксперимента меньше 0.8, его целесообразно проводить.

Статистическая игра с единичным неидеальным экспериментом

Мы имеем стратегии статистика:

;

Состояния природы:

;

Вектор априорных вероятностей:

;

Матрица выигрышей:

;

Множество возможных исходов единичного эксперимента:

;

Матрица условных вероятностей:

;

Цена эксперимента С.

Надо решить два вопроса:

Целесообразно ли проводить эксперимент?
Если да, то какая из стратегий должна быть выбрана в качестве оптимальной?

Решение данной задачи основано на формуле Байеса. Выведем ее.

По теореме умножения вероятностей

- вероятность наступления исхода эксперимента.

По формуле полной вероятности

Объединяя эти две формулы, мы можем записать формулу Байеса для определения апостериорных вероятностей существования j^го состояния природы, если эксперимент имел q^й исход:

Определим теперь для каждой стратегии i средний выигрыш с учетом апостериорных вероятностей.

Это есть условие среднего выигрыша при стратегии x_i при условии, что эксперимент дал результат S_q.

Найдем для каждого q соответствующий оптимальный выигрыш:

Теперь надо усреднить этот результат по всем возможным исходам S_q, т.е. по вероятностям h_q наступления каждого исхода, которые находим по формуле полной вероятности

Получим a_S – выигрыш, который в среднем ожидается при проведении неидеального эксперимента.

Найдем также средний выигрыш, рассчитанный по априорным вероятностям:

Если a_S- a>C, то эксперимент проводить целесообразно, иначе нет. В этом последнем случае пользуемся априорными вероятностями, т.е выбираем стратегию с номером .

Ответим на второй поставленный вопрос: какую стратегию выбрать, если неидеальный эксперимент проведен. В этом случае , зная, какой результат S_l дал эксперимент, мы пользуемся формулами

Пример.

Зададим матрицу платежей А и матрицу условных вероятностей W

Табл.1

	П₁	П₂	П₃	П₄
x A= ₁	1	4	5	9
x₂	3	8	4	3
x₃	4	6	6	2
q	0.1	0.2	0.5	0.2

Табл.2

	П₁	П₂	П₃	П₄
S₁	0.2	0.9	0.4	0.3
S₂	0.1	0.1	0.5	0.3
S₃	0.7	0	0.1	0.4

Если эксперимент не проводить, то по первой таблице мы можем найти оптимальную стратегию x₁ и выигрыш и 5.2.

Перейдем к определению условно-максимальных средних выигрышей a_q и соответствующих условно-оптимальных стратегий i_q для каждого возможного исхода эксперимента . S_q

Начнем с исхода S₁, для этого надо определить апостериорные вероятности V₁₁, V₂₁, V₃₁, V₄₁:

Теперь вместо первой таблицы мы получили:

	П₁	П₂	П₃	П₄	a_il
x₁	1	4	5	9	4.96
x₂	3	8	4	3	5.9
x₃	4	6	6	2	5.09
V_ji	0.43	0.392	0.335	0.13

Обрабатывая эту матрицу по известному алгоритму, мы находим

Если получим первый исход опыта S₁, то оптимальна стратегия i₁=2, выигрыш a₁=5.2;

Если получим второй исход опыта S₂, то оптимальна стратегия i₂=1, выигрыш a₂=5.53;

Если получим третий исход опыта, S₃, то оптимальна стратегия i₃=1, выигрыш a₃=5.53.

Ответим на вопрос, следует ли проводить эксперимент?

Найдем вероятности h_q соответственных исходов:

a_S=0.46·5.2+0.34·5.53+0.2·5.53=5.345

c< а_S-a=5.345-5.2=0.145

Если стоимость эксперимента меньше 0,145, то эксперимент надо проводить.

<<< < Предыдущая 1 2 3 4 5 67 / 77

Соседние файлы в папке Лекции

#
12.02.201564.51 Кб76Задача о рюкзаке.ppt
#
12.02.2015278.53 Кб42Лекция 1.doc
#
12.02.2015383.49 Кб41Лекция 2.doc
#
12.02.2015267.26 Кб45Лекция 3.doc
#
12.02.2015550.4 Кб73Лекция 4.doc
#
12.02.20153.41 Mб61Лекция 5.doc
#
12.02.2015362.5 Кб41Лекция 6.doc
#
12.02.2015302.59 Кб46Лекция 7.doc
#
12.02.201521.09 Кб33Литература.docx
#
12.02.2015115.71 Кб51Метод искусственного базиса.ppt
#
12.02.2015105.98 Кб48Метод потенциалов.ppt