- •Игры с природой (статистические игры)
- •1. Критерий максимума математического ожидания выигрыша.
- •II случай. Вероятности состояний природы известны.
- •1. Критерий максимума математического ожидания выигрыша.
- •Графический метод решения задач лп
- •Методика решения задач лп графическим методом
- •Симплекс метод решения задач лп
- •Решение
- •Задачи принятия решений в условиях полной неопределенности
Симплекс метод решения задач лп
Алгоритм решения задачи при помощи симплекс метода:
1. Вводятся
переменные, позволяющие систему
неравенств превратить в систему
уравнений. (Ограничение-неравенство
исходной задачи ЛП, имеющее вид «
»,
можно преобразовать в ограничение-равенство
добавлением к его левой части некоторой
новой неотрицательной переменной, а
ограничение-неравенство вида «
»
в ограничение равенство вычитанием из
его левой части неотрицательной
переменной. Переменные, вводимые для
преобразования ограничений-неравенств
в ограничения –
равенства
называют дополнительными.
Их
число равно числу преобразуемых
неравенств.)
2. Выбирается переменная (рабочая переменная) входящая в целевую функцию с max коэффициентом (Уничтожать переменные целесообразно, начиная с самой «неподходящей для итогового вида», таким образом, выбирается переменная, входящая в уравнение с целевой функцией, которую уничтожим в первую очередь).
3. Сравниваются частные от деления свободных членов на коэффициенты при этой переменной и выбирается строка с min > 0 частным от деления (рабочее уравнение). (Выбирается уравнение, в котором рабочая переменная имеет «наибольший вес» относительно других переменных).
4. Рабочее уравнение нормируется (т.е. делится на коэффициент перед рабочей переменной), из остальных строк исключаем рабочую переменную методом Гаусса. (Проведение данной операции обусловлено необходимостью исключить возможность проявления уже исключенной из уравнения с целевой функцией переменной в дальнейшем при последующих преобразованиях.)
5. Проверяется, существуют ли положительные коэффициенты перед переменными в уравнении с целевой функцией: если да, то возвращаются к пункту 2, если нет, то решение закончено.
В качестве примера рассмотрим задачу решенную графическим методом, задачу про краски.
Решение
Введем свободные переменные x3, x4, x5, x6, для того, чтобы систему неравенств превратить в систему уравнений.
Выбираем переменную, входящую в целевую функцию с максимальным коэффициентом, это x1. Сравниваем частные от деления свободных членов на коэффициенты при x1 6; 4; -1; +. Выбираем строку с min > 0 частным от деления и нормируем ее, из остальных строк исключаем x1 методом Гаусса.
Выбираем переменную, входящую в целевую функцию с max коэффициентом, это x2. Сравниваем частные от деления свободных членов на коэффициенты при x2 4/3; 8; 10/3; 2. Выбираем строку с min > 0 частным от деления и нормируем ее, из остальных строк исключаем x2 методом Гаусса.
Так как все коэффициенты перед переменными в уравнении с целевой функцией < 0, то решение законченно.
В
силу не отрицательности переменных из
уравнения,
содержащего целевую функцию следует,
что она достигает максимального значения,
в случае, когда x3
= 0 и x4
= 0, в этом случае
Задачи принятия решений в условиях полной неопределенности
В задаче принятия решения лицу принимающему решение (ЛПР) необходимо из множества альтернатив выбрать одну, лучшую в некотором смысле, в соответствии с выбранным принципом оптимальности (критерием эффективности). Эти задачи обладают той или иной степенью неопределенности.
Для ЛПР, действующего в условиях неопределенности и невозможности получения дополнительной информации о неопределенных факторах, элементами описания ситуации принятия решения являются:
-
множество допустимых стратегий (множество
возможных альтернатив действий ЛПР)
;
-
множество возможных состояний внешней
среды (множество гипотез)
.
Предполагается,
что на множестве отношений
можно задать некоторую функцию полезности
,
которая выступает в качестве меры
желательности или полезности
соответствующей альтернативы. Если
множества A
и S
конечны, то множество значений функции
полезности можно представить в виде
платежной матрицы:
|
S1 |
S2 |
… |
Sn |
A1 |
а11 |
а12 |
... |
а1n |
A2 |
а21 |
а22 |
... |
а2n |
… |
... |
... |
... |
... |
An |
am1 |
am2 |
... |
amn |
Строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj) – состояния внешней среды. Будем считать, что элементы платежной матрицы имеют смысл дохода, т.е. чем больше значение, тем лучше для игрока А. Хотя в некоторых ситуациях они могут иметь обратный смысл, тогда рассуждения, приведенные ниже, нужно поменять соответствующим образом.
Начинать анализ платежной матрицы следует с определения множетсва Парето: исключить из платежной матрицы «заведомо невыгодных» стратегии игрока А (доминируемые). Удалять доминируемые стратегии – состояния окружающей среды нельзя, т.к. они принципиально не могут быть выгодными или невыгодными.
Решение определяется с помощью критериев. Согласно каждому критерию всем стратегиям ЛПР ставится в соответствие некоторое число Wi, среди которых выбирается «наилучшее» в смысле используемого критерия, этому числу соответствует оптимальная стратегия.
К сожалению, не существует общих правил оценки практической применимости того или иного критерия при принятии решений в условиях неопределенности. Скорее всего, это связано с тем, что поведение ЛПР, обусловленное неопределенностью ситуации, по всей видимости, является наиболее важным фактором при выборе подходящего критерия.
Критерий
Байеса (критерий максимального
математического ожидания). При
использовании этого критерия ЛПР должны
быть известны вероятности, с которыми
система (окружающая среда) находится в
каждом из своих состояний S1,
S2,
…, Sn.
Обозначим эти вероятности соответственно
p1,
p2,
…, pn,
при этом
.
Информация о вероятностях состояний
окружающей среды может быть известна,
например, на основе данных статистических
наблюдений.
Оптимальным можно считать такое поведение ЛПР, при котором максимизируется его средний выигрыш (математическое ожидание выигрыша). Речь идет о максимизации среднего выигрыша при многократном повторении принятия решения.
Каждая строка дополняется числом:
,
.
Среди
всех Wi,
выбирается максимальное (которому и
соответствует оптимальная стратегия):
.
Критерий недостаточного основания Лапласа. Если вероятности состояний окружающей среды примерно равны, или нет о них информации, то можно пользоваться критерием Лапласа:
,
,
.
Максиминный
критерий Вальда. Это
критерий крайнего пессимизма, его
использование абсолютно исключает
риск:
,
,
.
Критерий
пессимизма-оптимизма Гурвица. Крайнему
пессимизму можно противопоставить
крайний оптимизм (критерий
азартного игрока),
когда ставка делается на самый большой
возможный выигрыш, т.е. на самый большой
элемент платежной матрицы:
,
,
.
Но
такой критерий принятия решения
практически не применятся. Зато
применяется критерий «умеренного
оптимизма», который называют критерием
пессимизма-оптимизма Гурвица (а также
критерием обобщенного максимума).
Вводится коэффициент
пессимизма
,
который определяется из соображений
правдоподобия, здравого смысла или
просто из интуитивных соображений (чем
больше значение С, тем больше пессимизма).
,
,
.
При
имеем критерий азартного игрока
(пессимизм отсутствует).
При
имеем максиминный критерий Вальда –
позиция крайнего пессимизма.
Критерий
Ходжа-Лемана. Этот
критерий является промежуточным между
критерием Байеса и максиминным критерием
Вальда. Если есть сомнения относительно
достоверности информации о вероятностях
состояний окружающей среды, то можно
ввести соответствующий параметр
– параметр достоверности информации
о вероятностях состояний окружающей
среды. Чем меньше значение u,
тем сильнее на принятие решения влияет
исключение риска по критерию Вальда.
,
,
.
При
имеем критерий Вальда.
При
имеем критерий Байеса.
Критерий
минимаксого риска Сэвиджа. Наряду
с платежной матрицей можно рассматривать
матрицу
рисков.
Если бы ЛПР знал, в каком состоянии будет
внешняя среда, например Sj,
то он выбрал бы ту свою стратегию, которая
соответствует максимальному элементу
j-го
столбца (максимальному выигрышу при
состоянии Sj).
В этом случае риск ЛПР – потеря этого
максимального выигрыша – равен нулю
(r = 0).
Риски для других стратегий – положительны,
они равны разнице между максимальным
элементов столбца и данным элементом:
,
где
– максимальный элемент j-го
столбца.
При анализе матрицы рисков цель ЛПР – минимизировать свой риск. Для матрицы рисков критерий рассчитывается следующим образом:
,
,
.
Пример. Платежная матрица имеет вид:
|
S1 |
S2 |
S3 |
А1 |
2 |
-3 |
7 |
А2 |
-1 |
5 |
4 |
А3 |
-7 |
13 |
-3 |
pj |
0,2 |
0,5 |
0,3 |
Определить наиболее выгодную стратегию по всем критериям, если коэффициент пессимизма С = 0,4; коэффициент достоверности информации о вероятностях состояний u = 0,6.
Решение
Результаты расчетов будем заносить в таблицу:
|
S1 |
S2 |
S3 |
Б |
НО |
ММ |
П-О |
Х-Л |
А1 |
2 |
-3 |
7 |
1 |
2 |
-3 |
3 |
-0,6 |
А2 |
-1 |
5 |
4 |
3,5 |
2,7 |
-1 |
2,6 |
1,7 |
А3 |
-7 |
13 |
-3 |
4,2 |
1 |
-7 |
5 |
-0,28 |
pj |
0,2 |
0,5 |
0,3 |
А3 |
А2 |
А2 |
А3 |
А2 |
1. Критерий Байеса (максимального математического ожидания)
;
;
.
Найденные
значения заносим в первый столбец (Б) и
выбираем максимальное
,
значит оптимальной по данному критерию
является стратегия А3 – продавать в
весенние месяцы.
2. Критерий недостаточного основания Лапласа (НО)
;
;
.
Найденные
значения заносим во второй столбец (НО)
и выбираем максимальное
,
значит оптимальной по данному критерию
является стратегия А2 – продавать в
зимние месяцы.
3. Максиминный критерий Вальда (ММ)
;
;
.
Найденные
значения заносим в третий столбец (ММ)
и выбираем максимальное
,
значит оптимальной по данному критерию
является стратегия А2 – продавать в
зимние месяцы.
4. Критерий пессимизма-оптимизма Гурвица (П-О)
Для
каждой строки рассчитываем значение
критерия по формуле:
.
По условию
,
значит:
;
;
.
Найденные
значения заносим в четвертый столбец
(П-О) и выбираем максимальное
,
значит оптимальной по данному критерию
является стратегия А3 – продавать в
весенние месяцы.
5. Критерий Ходжа-Лемана (Х-Л)
По
условию
и множители в каждом слагаемом уже
рассчитаны, их можно взять их первого
столбика (Б) и из третьего столбика (ММ),
значит:
;
;
.
Найденные
значения заносим в пятый столбец (Х-Л)
и выбираем максимальное
,
значит оптимальной по данному критерию
является стратегия А2 – продавать в
зимние месяцы.
5. Критерий минимаксного риска Сэвиджа
Рассчитаем матрицу рисков. Заполнять ее лучше по столбцам. В каждом столбце находим максимальный элемент и вы читаем из него все остальные элементы столбца, результаты записываем на соответствующих местах.
Вот
как рассчитывается первый столбец.
Максимальный элемент в первом столбце:
,
значит по формуле
:
;
;
.
Рассчитаем
второй столбец матрицы рисков. Максимальный
элемент во втором столбце:
,
значит:
;
;
.
Рассчитаем
третий столбец матрицы рисков. Максимальный
элемент в третьем столбце:
,
значит:
;
;
.
Таким образом, матрица рисков имеет вид (в каждом столбце на месте максимального элемента платежной матрицы должен стоять ноль):
|
|
|
Wi |
0 |
16 |
0 |
16 |
3 |
8 |
3 |
8 |
9 |
0 |
10 |
10 |
Дополним матрицу рисков рассчитанными значениями критерия Wi – в каждой строке выбираем максимальный элемент ( ):
;
;
;
Найденные
значения заносим в столбец (Wi)
и выбираем минимальное
,
значит оптимальной по данному критерию
является стратегия А2 – продавать в
зимние месяцы.
