Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
РАЗРАБОТКА УПРАВЛЯЮЩИХ РЕШЕНИЙ ДЛЯ КРИЗИСНЫХ СИ...doc
Скачиваний:
1
Добавлен:
14.11.2019
Размер:
1.92 Mб
Скачать

IX. Математические методы принятия решений

1.1. Постановка задачи и основные определения

Матожидание -оценка среднего, полученная по известной функции распределения вероятностей. Это ожидаемое, предвосхищаемое значение среднего.

Среднее может быть оценено и по выборке, тогда оно называется выборочным средним. Если функция распределения доподлинно известна, то матожидание совпадает с генеральным средним. Риск - это матожидание потерь. Он рассчитывается по формуле:

, где -потери при наступлении k-го исхода, вероятность которого , а число всех возможных взаимоисключающих исходов равно S.

С помощью сравнения матожиданий принимают решения при выдаче кредитов в банках, а также при управлении запасами в торговых точках.

Будем полагать, что лицо, принимающее решение (ЛПР), имеет возможность выбора из вариантов своих действий а1, а2 … аm. В ответ некий противник выдает одну из своих возможных n реакций. Допустим, ЛПР выбрало i–е действие и получило в ответ j-ю реакцию. Совместными действиями ЛПР и его противника порождается ситуация, характеризуемая для ЛПР полезностью . Когда значение полезности отрицательно, оно называется антиполезностью или вредом. Будем также полагать, что ЛПР не знает определённо, какой ответ выберет противник, но вероятности реакций противника могут быть или известны, или частично известны, или же эти вероятности могут быть совсем неизвестны. Однако в любом случае выполняется условие

Задача состоит в том, чтобы выработать для ЛПР правила отбора вариантов на основе анализа матрицы . Правила отбора вариантов принято называть критериями принятия решений(КПР).

Классификация противников. Противник, не стремящийся уменьшить выигрыш или увеличить проигрыш лица, принимающего решение, называется равнодушным противником. В роли равнодушного противника обычно выступает природа. Противника, который стремится уменьшить выгоду лица, принимающего решение, чтобы увеличить собственную, естественно называть конкурентом.

И наконец, враг – это тот, кто стремится не только уменьшить выгоду противника, но и увеличить его потери даже ценой собственных потерь.

Определение стратегии. Последовательное использование какого-либо определенного КПР или определенного набора КПР в серии принимаемых решений будем называть стратегией.

1.2. Наиболее известные стратегии

Итак, представление задачи о принятии решения сводится к тому, что ЛПР выбирает строку в матрице полезности, которая представляет собой как бы меню из возможных ответов противника. После того как ЛПР выбрал строку, противник с какой-то вероятностью «преподносит» ему нечто из этого меню, но обязательно что-то одно, характеризуемое значением полезности .

Р ис.1. Вид матрицы принятия решений

На рис.1. столбцы соответствуют ответам противника, а строки - выбору ЛПР.

Стратегия Пессимиста. Человек, который не верит в свою удачу, последовательно, раз за разом, выбирает строку, содержащую минимальный из всех возможных проигрышей. Он как бы говорит себе: «Все равно я проиграю, так пусть мой проигрыш будет как можно меньше».

Процедура выбора содержит следующие этапы:

а) ищется минимум в каждой строке:

б) ищется та строка, которая содержит элемент

Допустим, содержится в k-й строке. Значит, Пессимист отдаст предпочтение действию , соответствующему k-й строке матрицы.

По-другому эта стратегия называется «стратегией максимина».

Стратегия Авантюриста. Авантюрист безрассудно верит в свою удачу. Он последовательно, раз за разом выбирает строку, содержащую максимальный из возможных выигрышей, в надежде, что именно он-то ему и выпадет, и ему обязательно удастся «сорвать куш». Процедура выбора содержит следующие этапы:

а) ищется максимум в каждой строке

б) ищется та строка, которая содержит элемент

Допустим, содержится в l-й строке. Значит, Авантюрист отдаст предпочтение действию, соответствующему этой строке матрицы.

Стратегия Рационалиста. Рационалист отдает себе отчет в том, что он рискует, осуществляя выбор, и потому неизменно выбирает строку, в которой максимально математическое ожидание выигрыша. Процедура выбора содержит этапы:

а) для каждой строки составляется сумма:

б) далее ищется строка, для которой

.

Допустим, содержится в r-й строке. Значит Рационалист отдает предпочтение действию, соответствующему r-й строке матрицы. Это есть решение, принятое на основе сравнения матожиданий. С помощью сравнения матожиданий принимают решения при выдаче кредитов в банках, а также при управлении запасами в торговых точках.

Стратегия Сэвиджа(Savage). Она состоит в последовательном применении критерия Сэвиджа. Чтобы пояснить сущность этого критерия, построим дополнительную строку из максимумов по столбцам

А именно, .

Элементами этой строки являются наивыгоднейшие для нас ответы противника (природы) по каждому варианту нашего выбора.

Если у ЛПР при j-м ответе противника задействована не какая-то произвольная i-я альтернатива, а оптимальная для этого ответа, то ЛПР получает дополнительный выигрыш по сравнению с применением своей i-й альтернативы, и он равен

.

Это максимальная добавка к выигрышу, которая могла бы быть, если бы мы заранее знали ответ противника. А можно сказать, что это штраф за то, что мы не знаем ответа противника и использовали i-ю альтернативу вместо оптимальной в этой ситуации.

Обозначим через - максимально возможный при любых ответах противника штраф, когда мы выбрали i-ю альтернативу.

Далее рассмотрим , где k- номер строки, в которой указанный минимум наблюдается.

По критерию Сэвиджа мы выбираем именно k-ю альтернативу, то есть ту, в которой минимизируются максимальные дополнительные, по сравнению с оптимальным выбором, потери. Можно сказать, что это «стратегия утешения». Если человек, используя стратегию Сэвиджа, не взял главный приз, то он, по крайней мере, выходит из игры с сознанием того, что его разочарование не самое большое из всех возможных.

Стратегия Гурвица. Она состоит в последовательном применении критерия Гурвица. Этот критерий - промежуточный между критериями Пессимиста и Авантюриста:

а) выбирается «уровень пессимизма» ;

б) составляется столбец

.

Этот столбец содержит средневзвешенное от наименьшей и наибольшей полезностей, найденных в каждой строке. Средневзвешенное получено с помощью весов с и (1-с).

в) выбирается k-я альтернатива, для которой .

Для с=1 этот критерий вырождается в критерий Пессимиста, или минимаксный, а для с =0 получается критерий Авантюриста.

Критерий Гурвица и стратегия Гурвица применяются в ситуациях, когда вероятности неизвестны.

Критерий Ходжа-Лемана. Как и предыдущий, этот критерий является компромиссным. Но, в отличие от критерия Гурвица, он опирается на другие критерии, а именно, одновременно на критерий Пессимиста и критерий Рационалиста ( Байеса-Лапласа). Его можно назвать «критерий Пессимистического рационалиста» или «критерий Рационалистического пессимиста». Он учитывает неточность в наших знаниях распределений вероятностей ответов противника.

Вводится параметр , , отражающий степень доверия к используемому распределению вероятностей. Если это доверие велико, используется критерий Байеса-Лапласа(Рационалиста), если нет – минимаксный (Пессимиста).

В этом случае формируется столбец:

.

Решение принимается в пользу k-й альтернативы, для которой .

Стратегия Гермейера. Она опирается на критерий Гермейера. В каждой строке ищется ответ противника с минимальным матожиданием:

.

(Суммирования по строке нет!)

Затем выбирается k-я альтернатива, дающая , то есть дающая наибольшее из наименьших матожиданий, иначе: наилучшее из худших матожиданий. Когда вероятности одинаковы (равномерно распределены), критерий Гермейера идентичен минимаксному.

Возникает вопрос: когда какая стратегия предпочтительней?

Ответы содержатся в структуре матриц U и Р. Если в матрице U много отрицательных больших по модулю элементов, а в матрице Р все вероятности примерно равны или неизвестны, то предпочтительна стратегия Пессимиста. Если же отрицательных элементов нет, то лучше стратегия Авантюриста.

Когда вероятности хорошо известны, потери не могут быть фатальными и решения принимаются многократно, то следует использовать стратегию Рационалиста.

Параметр доверия можно оценивать по дисперсиям оценок элементов матрицы вероятностей, предложенных различными экспертами.

Уровень пессимизма с можно оценить, сравнив по модулю суммарные положительные и отрицательные элементы матрицы полезностей.

Однако следует заметить, что знание стратегии не означает, что человек ею пользуется: знание техники плавания не тождественно умению плавать.