Матрица решений

Для более удобной систематизации задач, решаемых с помощью ЭММ игрового характера используется матрица решений.

Если определена матрица решений с оценками условий и вероятностями реализации для всех состояний среды, мы можем определить ожидаемую стоимостную оценку (EMV – expected monitory value) для каждой альтернативы. Выбор альтернативы с максимальной EMV является одним из наиболее распространенных критериев. Для каждой альтернативы EMV есть сумма всевозможных оценок условий (выигрышей), умноженных на вероятности реализации этих выигрышей.

Дерево решений

Таблицу решений удобно использовать при анализе задач, имеющих одно множество альтернативных решений и одно множество состояний среды. Если имеют место два или более последовательных решений и последующее решение основывается на исходе предыдущего, более предпочтительным является подход, основанный на построении дерева решений.

Дерево решений - это графическое изображение процесса решений, в котором отражены альтернативные решения, состояния среды, соответствующие вероятности и выигрыши для любых комбинаций альтернатив и состояний среды.

Составляя дерево решений, нужно нарисовать “ствол” и “ветви”, отображающие структуру проблемы. Располагаются деревья слева направо. “Ветви” обозначают возможные альтернативные решения, которые могут быть приняты и возможные исходы, возникающие в результате этих решений. “Квадратные узлы” на схеме обозначают места, где принимается решение, круглые узлы - появление исходов. Так как. ЛПР не может влиять на появление исходов, ему остается лишь вычислить вероятность их появления.

Когда все решения и их исходы указаны на “дереве”, просчитывается каждый из вариантов, и в конце проставляется его денежный доход. Все расходы, вызванные решением, проставляются на соответствующей “ветви”.

Анализ задач с помощью дерева решений включает 5 этапов:

Формулировка задачи
Построение или изображение “дерева” решений
Оценка вероятностей состояния среды
Установление выигрышей для каждой возможной комбинации альтернатив и состояний среды
Решение задач путем расчета ожидаемой стоимостной ценности (EMV) для каждой вершины состояния среды

Методы теории игр

Теория игр– наука, исследующая математическими методами поведение участников в вероятностных ситуациях, связанных с принятием решений. Предметом этой теории являются игровые ситуации с заранее установленными правилами (типа игры в карты или в домино). В ходе игры возможны различные совместные действия - коалиции игроков, конфликты и т.д. Стратегия игроков определяется целевой (платежной) функцией, которая показывает выигрыш или проигрыш участника. Формы этих игр многообразны.

Классификация игр:

По числу игроков
По возможности предварительной договоренности: кооперативные (когда образуются коалиции игроков) и некооперативные (когда каждый играет за себя против всех).
По количеству стратегий (конечная и бесконечная игра)
По наличию элементов случайности
По свойству функции выигрыша (с нулевой и ненулевой суммами)
По правилам осуществления ходов (статические – одновременные ходы, динамические – последовательно)
По информации, которой располагает игрок (с полной и неполной информацией)

Наиболее простая разновидность - игры с двумя участниками. Если в игре участвуют не менее трех игроков, возможно образование коалиций, что усложняет анализ. С точки зрения платежной суммы игры делятся на две группы - с нулевой и ненулевой суммами. Игры с нулевой суммой называют еще антагонистическими: выигрыш одних в точности равен проигрышу других, а общая сумма выигрыша равна нулю.

Наиболее известный пример некооперативной игры с ненулевой суммой -»дилемма заключенного».

С поличным поймали двух воров, которым предъявлено обвинение в ряде краж. Перед каждым из них встает дилемма, признаваться ли в старых (недоказанных) кражах или нет. Если признается только один из воров, то признавшийся получает минимальный срок заключения (1 год), а его нераскаявшийся товарищ - максимальный (10 лет). Если оба вора одновременно признаются, то оба получат небольшое снисхождение (по 6 лет заключения); если оба будут упорствовать, то обоим дадут наказание только за последнюю кражу (по 3 года). Заключенные сидят в разных камерах и не могут договориться друг с другом. Перед нами некооперативная (несогласованная) игра с ненулевой (в данном случае отрицательной) суммой. Характерной чертой этой игры является невыгодность для обоих участников руководствоваться своими частными (корыстными) интересами.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2221 22 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.06.201512.13 Mб99Robert I. Kabacoff - R in action.pdf
#
02.06.20152.89 Mб40Rossyskoe_zakonodatelstvo_X_XX_vekov_V_9-ti.doc
#
24.09.20195.23 Mб76RPZ.doc
#
01.05.2025136.7 Кб1RP_NIR_MEI_FM.doc
#
26.03.2016112.64 Кб5Rules.doc
#
26.03.2016233.33 Кб140RUR2012.docx
#
26.03.2016355.13 Кб9Russia2013.pdf
#
01.04.2025110.59 Кб1RWS_S_R_R_S_S_S_Ryo_RyeR_S_R_RiR_S_RyoRyo_R_R_R...doc
#
02.06.2015407.24 Кб7Rynochnoe_ravnovesie.pdf
#
26.03.20167.68 Mб5Sahlin-OriginalAffluentSociety-abridged.pdf
#
02.06.20151.5 Mб43SAL_chast_1.pdf