Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР2.docx
Скачиваний:
9
Добавлен:
18.11.2019
Размер:
240.89 Кб
Скачать

Московский Авиационный Институт

(Государственный Технический Университет)

Лабораторная работа №2

по курсу

«Исследование операций и теория принятия решений»

«Выбор байесовских и минимаксных стратегий в теории решений»

Выполнили

студентов гр. 03-423

Черкасов Р.

Решетников Д.

Проверил

Романов О. Т.

Москва

2011 г.

Цель работы – овладение основными методами отыскания оптимальных (байесовских и минимаксных) стратегий выбора действия (решения) в неопределенной ситуации.

Постановка задачи.

Модель принятия решений включает в себя:

  • множество возможных состояний природы S{Si}, порождающее неопределенность ситуации;

  • множество возможных действий D{dj}, причем правильность выбора каждого из действий зависит от истинного состояния природы;

  • функцию потерь U(d, S), посредством которой можно оценить результаты применения любого из возможных действий, если истинное состояние природы si;

  • эксперимент, проводимый для получения информации о состоянии природы, но возможные его результаты хнХ зависят не только от состояния природы, но и от точности эксперимента;

  • множество стратегий А{а}, каждая из которых есть совокупность правил, предписывающих определенное действие djD xlX.

Задача заключается в том, чтобы из всего множества возможных стратегий выбрать оптимальную в смысле какого-либо критерия.

Задание.

  1. Придумать вариант задачи для S{s1, s2}, D{d1, d2, d3}, X{x1, x2, x3}. Задаться функцией потерь в виде матрицы U(dj, si) и распределением вероятностей p(X=xl/si).

  2. Перечислить все возможные стратегии аА.

  3. Построить графическое отображение множества стратегий А{a, } на множестве условных средних потерь r(a, si) и обозначить границы этого отображающего множества. Перечислить все допустимые стратегии.

  4. Для пары допустимых стратегий ai и aj составить смешанную стратегию из условия их применения с вероятностями (1-р) и р соответственно.

  5. Вычислить средние потери для всех допустимых стратегий и определить байесовскую стратегию аналитически и с помощью опорных прямых.

  6. Найти минимаксную стратегию (анализируя результаты расчетов и графически).

  7. Оформить отчет.

Задача

Студент приходит на экзамен. Возможно два состояния:

s1 – Мягкий преподаватель.

s2 – Жестки преподаватель.

Возможные действия:

d1 – Списывать со шпаргалки;

d2 – Отвечать собственными силами;

d3 – Прийти в следующий раз.

Эксперименты:

x1 –Не задает дополнительных вопросов;

x2 –Задает много дополнительных вопросов;

x3 – Задает один дополнительный вопрос.

Матрица потерь

U(dj, si)

Характеристика эксперимента

p(X=xl/si)

Состояние

природы

Возможные действия

Результаты эксперимента

d1

d2

d3

x1

x2

x3

s1

s2

1

3

0

2

7

6

0,5

0,5

0,2

0,1

0,3

0,4

Решение

Если каждому из трех возможных результатов эксперимента поставить в соответствие одно из трех возможных действий , то получим множество , состоящее из 27 возможных стратегий:

Результаты эксперимента

С т р а т е г и и

Каждая стратегия определяет способ действия D в зависимости от случайного исхода эксперимента, т.е. . Поэтому эффективность каждой стратегии может быть оценена путем вероятностного усреднения потерь по всем реализациям D при фиксированном состоянии природы. Эта оценка называется условными средними потерями и вычисляется по формуле:

, где - вероятность того, что в данной стратегии при состоянии природы будет предпринято действие . Она вычисляется по формуле полной вероятности: , где вероятность - вероятность появления одного из возможных результатов эксперимента, а - вероятность того, что в данной стратегии результату эксперимента поставлено действие .

Таблица условных потерь:

a1

a2

a3

a4

a5

a6

a7

a8

a9

a10

a11

a12

a13

a14

a15

a16

a17

a18

a19

a20

a21

a22

a23

a24

a25

a26

a27

s1

1

0.7

2.8

0.8

0.5

2.6

2.2

1.9

4

0.5

0.2

2.3

0.3

0

2.1

1.7

1.7

3.5

4

3.7

3.5

3.8

3.5

3.5

5.2

4.9

7

s2

3

2.6

4.2

2.9

2.5

4.1

3.3

2.9

4.5

2.5

2.1

3.7

2.4

2

3.6

2.8

2.4

4

4.5

4.1

5.7

4.4

4

5.6

4.8

4.4

6

Графическое отображение множества возможных стратегий на множестве условных средних потерь:

Составим для пары допустимых стратегий и смешанную стратегию из условия их применения с вероятностями (1-p) и p соответственно. Зададим значение .

В общем случае, если две чистые стратегии и используются с вероятностями, равными соответственно и , то смешанную стратегию обозначают, как , а условные средние потери для нее вычисляются следующим образом:

и

.

Точка лежит на отрезке , деля его в отношении , а значит, и любая точка этого отрезка представляет некоторую случайную смесь стратегий и . Выберем две допустимые стратегии .

Подсчитаем условные средние потери:

Рассмотрим статически определенную ситуацию с известными априорными вероятностями возможных состояний природы и .

Зададим . Итак,

.

Условные средние потери и являются функциями случайной величины s. Вероятностным усреднением по всем состояниям природы можно получить средние потери , свободные от природной случайности s и являющиеся более общей оценкой эффективности стратегии:

.

Подсчитаем вероятностное усреднение для всех таких стратегий:

Стратегии

2.6

1.935

3.71

2.165

1.8

3.575

2.915

2.55

4.325

1.8

1.435

3.21

1.665

1.3

3.075

2.415

2.155

3.825

4.325

3.96

4.93

2.993

3.825

4.865

4.94

4.575

6.35

Оптимальной при заданных априорных вероятностях и называют такую стратегию , для которой средние потери

; называют байесовскими потерями или байесовским риском, а стратегию - байесовской.

В нашем случае это стратегия . .

Определим графически байесовскую стратегию. Ее можно найти, используя графическое множество стратегий и, так называемые, опорные прямые. Прямая называется опорной прямой множества A в граничной точке этого множества, если она проходит через и при этом множество A целиком лежит по одну сторону от этой прямой.

Известно, что прямая при изменении c перемещается параллельно самой себе. Можно доказать, что для любой допустимой стратегии существует пара однозначных коэффициентов и и прямая , проходящая через отображающую точку этой стратегии, является опорной прямой множества A в этой точке. При этом множество стратегий лежит правее этой прямой, т.е. для всех точек множества A и в точке , а выражение удовлетворяет рассмотренным свойствам.

Итак, чтобы графически найти оптимальные байесовские стратегии, нужно построить прямую , лежащую ниже множества A, и, увеличивая c, сдвинуть эту прямую вверх параллельно самой себе.

Приведем на графике отображение данной прямой.

Таким образом, получаемая байесовская стратегия – это стратегия . Она же является и допустимой. Решение аналитического метода и графического абсолютно совпали.

Это было для статически определенной ситуации с известными априорными вероятностями возможных состояний природы и . В случае статически неопределенной ситуации оптимальной будет минимаксная стратегия , для которой . Минимаксный подход к выбору стратегии гарантирует минимальные условные потери при наихудшем состоянии природы. Найдем стратегию . По полученным результатам значение , что соответствует стратегии . Найдем решение задачи, используя графический метод.

Для этого строится вспомогательное множество точек, имеющее вид клина со сторонами, параллельными координатным осям с вершиной в точке . Затем, увеличивая c, сдвигают клин вправо и вверх. Точка, в которой этот клин в первый раз коснется множества A, соответствует минимаксной стратегии. Если клин касается множества A своей вершиной, то условные средние потери при минимаксной стратегии одинаковы для обоих состояний природы. Если касание происходит по линии, то оптимальной будет допустимая стратегия.

Проиллюстрируем данный метод на графике.

В результате, получаем клин с вершиной в точке (2.857;2.857).

Вершина клина лежит на отрезке, соединяющем точки (2; 5) и (2.3; 1.5).

Уравнение прямой .

Чтобы найти, вершину клина, решим уравнение: .

Получили точку

Она делит найденные отрезок на два, длина первого , длина второго .

Следовательно, искомая минимаксная стратегия .

Выводы

В данной работе были рассмотрены различные подходы к решению задачи игры с природой. При различных заданных начальных условиях применяются различные методы решения. Так, например, при решении задачи статически определенной с известными априорными вероятностями состояний природы использовался байесовский подход. Причем как аналитическое решение, так и графическое. Полученная при этом стратегия являлась допустимой и была решением каждого из используемых методов.

При статически неопределенной задаче использовался другой подход - минимаксный, который также можно было разделить на графический метод решения и аналитический. Решение аналитического метода совпало с графическим.

Таким образом, при решении подобных задач необходимо анализировать результаты решения, полученные при использовании различных методов, так как только в этом случае можно получить самые оптимальные с точки зрения минимизации потерь решения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]