Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция_opt1.doc
Скачиваний:
4
Добавлен:
11.11.2019
Размер:
887.81 Кб
Скачать

4.Принципы оптимальности

Принципы оптимальности это формальные описания различных представлений об оптимальности, отражающие те или иные аспекты интуитивного понимания обоснованности и целесообразности. Эти черты группируются вокруг содержательных представлений об устойчивости, выгодности и справедливости. Существенно, что одновременная реализация всех (или хотя бы достаточно большого числа) аспектов оптимальности оказывается невозможной ввиду их формальной несовместимости. Анализ возникающих при этом возможностей, трудностей и границ удается проводить на основе аксиоматического метода. По мере того, как разделы теории принципов оптимальности приобретают аксиоматический характер, вырабатываются все новые (как бы синтетические) принципы оптимальности, не всегда обладающие интуитивной очевидностью. Поэтому важной задачей теории принципов оптимальности является формулировка общедоступных для понимания и общеубедительных аксиом, из которых чисто дедуктивно выводятся отдельные принципы оптимальности, не обязательно очевидные априори.

В классической задаче принятия оптимальных решений применяется тривиальный принцип оптимальности, заключающийся в максимизации целевой функции (функции полезности) на множестве имеющихся альтернатив. Принцип оптимальности следует отличать от критерия оптимальности, который в этом контексте – другое название целевой функции. В более сложных задачах принятия решений, в которых результат выбранного лицом решения либо известен ему не полностью, либо не может быть оценен с единой точки зрения (в частности одним числом). Такие задачи относятся к теории игр и к полиоптимизации. Поэтому принципы оптимизации могут быть разнообразными и довольно сложными.

Черты устойчивости проявляются в принципах оптимизации в виде целесообразности (или хотя бы отсутствия мотивов) отклонения от решений, принятых за оптимальные. В бескоалиционных играх соответствующим принципом оптимальности является принцип осуществимости цели, и его устойчивыми реализациями оказываются ситуации равновесия. К кооперативных играх устойчивы дележи из с-ядра, -ядро, -решение и т.д. Крайним воплощением устойчивости можно считать выгодность, если в оптимальном решении дальнейшее дел для одних участников (по одним критериям) может осуществляться лишь за счет других участников (по другим критериям). Как выгодные можно квалифицировать ситуации, оптимальные (эффективные) по Парето.

Концепция справедливости проявляется в виде симметрии: если участники задачи принятия оптимального решения находятся в симметричных положениях относительно условий задачи, то они должны находится в симметричных положениях и относительно ее оптимального решения. В бескоалиционных играх справедливыми оказываются симметричные ситуации, а в кооперативных – дележ, осуществляемый с помощью индекс силы игрока.

В кооперативной игре индекс силы игрока это функция , которая ставит в соответствие каждой кооперативной игре с характеристической функцией и множеством игроков вектор , удовлетворяющий некоторым свойствам. Компоненты этого вектора интерпретируются для баланса как выигрыши игроков в игре либо как их относительная сила.

Существуют различные способы задания такой функции. Один из них аксиоматический метод. Наиболее известной является аксиоматика Шепли:

  1. эффективность: если коалиция такова, что для любой коалиции выполняется равенство , то

;

  1. симметричность: если - перестановка множества и для любой коалиции имеет место , то ;

  2. линейность: .

Оказывается, что перечисленным аксиомам удовлетворяет единственная функция

.

В некоторых случаях, например, в задаваемых простыми играми модель голосования, применяют в качестве индекса силы игрока более простой вектор Банзафа , полагая,

.

В случае произвольной простой игры величина равна числу случаев, когда игрок является решающим для образования выигрывающей коалиции (т.е. когда , а ). Индекс силы игрока может быть определен как введенное Шмайдлером -ядро игры . Для каждого дележа определяется -мерный вектор , компоненты которого суть величины , упорядоченные по убыванию. -ядром называется такой дележ , что вектор лексиграфически меньше для любого дележа .

Если для какой-либо задачи тот или иной принцип оптимизации не имеет реализаций (т.е. в задаче нет оптимального в соответствующем смысле решения), то возможна постановка вопроса о таком расширении (обобщении) понятия решения, что среди обобщенных решений заведомо найдутся оптимальные. Так, для реализуемости принципа осуществимости цели в бескоалиционных играх подходящим расширением оказывается построение смешанного расширения, а для одновременной реализуемости этого принципа вместе с оптимальностью по Парето – метарасширения (в которых метастратегиями игроков будут их «ответы» на стратегии других игроков, «ответы на ответы» и т.д.). Если, наоборот, принцип оптимальности по отношению к условиям задачи принятия оптимального решения оказывается неполным и появляется много его реализаций, то возможна постановка вопроса об усилении этого принципа оптимальности с тем, чтобы множество реализаций сократить, доведя его в идеале до единственной реализации.

Иногда принципами оптимальности называются также правила сведения исходной задачи оптимизации к некоторым более простым задачам (например, принцип Беллмана в динамическом программировании, принцип максимума Понтрягина в оптимальном управлении).