- •1) Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.
- •1) Детерминированный случай
- •2) Оптимизация решений в условиях неопределенности
- •2) Методы принятия оптимальных решений. Оценка операции по нескольким показателям.
- •3) Оценка операции по нескольким показателям.
- •3) Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.
- •4) Геометрическая интерпретация озлп.
- •Анализ положения l относительно одр.
- •Дадим геометрическую интерпретацию поиска оптимального решения.
- •Тогда (x1*, x2*, …, xn*) – оптимальное решение
- •Некоторые выводы
- •5) Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.
- •6) Симплекс-метод решения задачи лп.
- •7) Табличный алгоритм замены переменных.
- •8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.
- •9. Отыскание оптимального решения задачи лп на основе табличного алгоритма замены переменных.
- •10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
- •11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.
- •12. Управление переходом организма из исходного состояния в конечное в условиях неопределенности.
- •13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
- •14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
- •15. Решение игры в смешанных стратегиях.
- •16. Игры 2х2 и их решение.
- •17. Геометрическая интерпретация решений игры 2х2.
- •18. Решение игр 2хn.
- •19. Решение игр mх2.
- •20. Решение игр mxn.
- •3.2. Элементы теории статистических решений
3.2. Элементы теории статистических решений
ВОЗМОЖНО, ДЛЯ MxN
Неопределенность в данном случае, это не какой-то разумный и враждебный противник, а природа. Это незаинтересованная сторона, у нее нет сознательных действий. Такие задачи часто называются «играми с природой». Их нельзя решать методами антагонистических игр, так как со стороны «природы» противодействие отсутствует.
У стороны А имеется m возможных стратегий: А1, А2, …, Am, о природе можно сделать n предположений: S1, S2, …, Sn. Последние можно рассматривать как состояния или стратегии природы. Наш выигрыш aij при каждой паре стратегий (Ai, Sj) задается матрицей, приведенной в табл.1. Требуется выбрать такую стратегию игрока А (чистую или смешанную), которая является наиболее выгодной для него.
Ai |
Sj |
|||
S1 |
S2 |
… |
Sn |
|
A1 |
a11 |
a12 |
… |
a1n |
A2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
Am |
am1 |
am2 |
… |
amn |
Sj – неизвестные состояния больного организма, а стратегии Ai – возможные планы лечения. Выигрыш aij – эффективность лечения, например вероятность выздоровления. В качестве такой вероятности можно использовать соответствующую частость, либо субъективную вероятность, задаваемую экспертом.
Учитывая, что состояниями природы мы не управляем, кроме показателя aij можно ввести другие, отражающие удачность выбора данной стратегии именно в данной ситуации. К таким показателям относится риск. Риском rij игрока А при пользовании стратегии Аi в условиях Sj называется разность выигрышем, который он получил бы, если бы знал условия Sj, и выигрышем, который он получит, не зная их и выбирая стратегию Аi. Следовательно,
rij = βj – aij
При поиске оптимальной стратегии игрока А в зависимости от выбранного показателя aij или rij либо максимизируется выигрыш, либо минимизируется риск.
Так как мы хотели бы иметь наибольший выигрыш и одновременно наименьший риск, то этот объединенный показатель fij, названный «сочетанным показателем полезности», вычисляется в виде
fij = aij – rij
Чем больше fij, тем лучше, т.к. больше выигрыш и меньше риск, поэтому при оптимизации выбора Аi показатель fij нужно максимизировать.
Пусть, для примера, больной организм может находится в одном из трех состояний: S1, S2, S3 – а у врача есть три варианта лечения: А1, А2, А3. Применение лечения Аi к больному в состоянии Sj приводит к вероятности выздоровления aij. Пусть значения aij задаются матрицей Ma в виде таблицы 2.α
Таблица 2
Ai |
Sj |
||
S1 |
S2 |
S3 |
|
A1 |
0,95 |
0,90 |
0,85 |
A2 |
0,97 |
0,92 |
0,75 |
A3 |
0,99 |
0,75 |
0,60 |
α1=0,85
α2=0,75
α3=0,60
β1=0,99 β2=0,75 β3=0,85
Рассчитаем по этой матрице значения αi приведены справа от соответствующих строк, а значения βj – под соответствующими столбцами. Матрица Mr получается из матрицы Ma вычитанием на основе соотношения
поэтому Mr имеет виды, представленный в табл.3. Наконец матрица Mf сочетанного показателя полезности fij определяется разностью Mf = Ma – Mr и имеет вид табл.4. Для этой матрицы также рассчитаны нижняя и верхняя цена игры
При нахождении минимальных стратегий игр по полученным матрицам Ma и Mf выполняются соотношения α=β, что говорит о наличии устойчивых чистых стратегий, определяемых седловой точкой. Для обеих матриц это оказалась одной и той же 0,85. В таблицах она определяет пару оптимальных чистых стратегий (А1, S3). В общем случае решение находится в области смешанных стратегий.
Наиболее прост для решения случай, когда заранее известны априорные вероятности состояний: P1=P(S1), P2=P(S2), …, Pn=P(Sn), причем P1 + P2 + … + Pn = 1. На практике чаще всего эти вероятности неизвестны. Если они известны, то при использовании показателя aij решение игры находится на основе максимизации среднего значения , где
с учетом вероятностей всех возможных условий, т.е. выбираем такую стратегию Аi, для которой
Очевидно, что при использовании показателя rij решение игры находится на основе среднего риска, т.е.
а для показателя fij
В теории доказывается, что та же стратегия, которая обращает в максимум средний выигрыш , обращает в минимум и средний риск . Там же показано, что при использовании вероятностей состояний применение смешанных стратегий для А не дает ему дополнительных преимуществ, поэтому можно обойтись чистыми стратегиями.