Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Диплом / Уч_Пособие.docx
Скачиваний:
55
Добавлен:
23.05.2015
Размер:
461.26 Кб
Скачать

Игра с нулевой суммой

X

Z

z1

z2

z3

z4

x1

5

-10

9

0

x2

6

7

8

1

x3

8

7

15

2

x4

3

4

-1

4


решение, отличное от x3, то мог, в зависимости от действий игрока Б, получить и меньшее значение выигрыша. Игрок Б (игра с нулевой суммой) стремится минимизировать наш выигрыш, тем самым и свой проигрыш. Т. е. игрок Б выбирает столбец, в котором максимальное число было бы наименьшим. Максминный критерий дает ,. Игрок Б не проиграет больше четырех условных единиц. Если игрок А выберетx** из условия то получитx**= x4, . В общем случае на основе гипотезы 2 можно получить лучший результат.

3. Допустим, что игрок Б поступает согласно гипотезе 2, т. е. использует стратегию . Игрок А с учетом этого выбирает оптимальное решение.

4. Пусть игрок А знает первый ход игрока Б. Тогда решение игрока А — x = x(z). Для каждого фиксированного z, можно определить искомое значение x, решая задачу оптимизации:

Можно определить гарантированный результат :

Результат будет отличаться от, найденного согласно гипотезе 1. Будем иметь:

Гипотеза 4 позволяет улучшить результат, полученный по принципу максминного гарантированного результата.

Доказательство (3.38). Неравенство (3.38) имеет вид:

Для любых двух фиксированных , справедливо неравенство:

где ,.

Пусть ,.

Тогда: .

Таким образом (3.40) доказано. Поскольку могут быть любыми, выберем;. Подставим эти значения в (3.40), получим (3.39).

Рассмотрим игру (таблица 3.3). . Дляимеем:.

5. Пусть Б знает ход А. Естественно предположить, что Б будет придерживаться стратегии z = z(x), которая является решением оптимизационной задачи:

(согласно гипотезе 4). Сохраняем допущение, что субъект А сообщил свой ход субъекту Б, а также допущение об использовании субъектом Б стратегии z(x). Это позволяет субъекту А воздействовать на выбор субъекта Б, чтобы он в максимальной степени соответствовал целям субъекта А. Выбор субъекта А:

Если максимум (3.41) достигается не в одной точке z, а на некотором множестве M(x), то гарантированный результат определяется как:

Общим для рассмотренных выше случаев является предположение, что обе стороны точно знают свои цели и информированы о целевых функциях «противника». Что не всегда выполняется для реальных конфликтных ситуаций. Чаще о целях наших партнеров имеют ограниченную информацию. Необходимо учитывать возможную сознательную дезинформацию.

3.7. Многомерные модели принятия решений

Из многомерных моделей наиболее часто используются аддитивные и мультипликативные многомерные функции полезности. Функцией полезности (ценности) называется скалярная функция U, устанавливающая отношение порядка на множестве вариантов:

где ;— точки пространства последствий (критериального пространства). Обобщенная форма аддитивной модели полезности:

где U — функция полезности варианта j; — вес фактора (свойства)i; — оценка полезности вариантаj по свойству i. Обобщенная форма мультипликативной функции полезности:

Оценки , как правило, получают экспертным путем, но могут задаваться и аналитически, применением подходящей аппроксимирующей функции.

В теории принятия решения доказывается, что функция полезности имеет аддитивный вид, если факторы, входящие в модель, аддитивно независимы. Функция полезности имеет мультипликативную форму, если факторы взаимно независимы по полезности. Первое требование означает уверенность эксперта в том, что модель является линейной по факторам, а второе — что модель содержит взаимодействия факторов различных порядков. На практике обычно веса нормализуют так, что обе формы представления оказываются эквивалентными (могут быть преобразованы друг в друга).

Стандартная процедура сравнения вариантов по многим факторам содержит следующие шаги: формулирование задачи, выбор факторов; построение дерева решений; назначение весов факторам и их нормализация; подсчет показателей (баллов) по всем факторам для каждого варианта; получение взвешенных оценок и суммарного числового выражения полезности для каждого варианта. Основные неформальные шаги в приведенном алгоритме — выбор факторов, построение дерева решений и назначение весов факторов.

Многомерные модели сравнения вариантов различаются подходами к установлению весов факторов и схемами их агрегирования.

Рассмотрим проблемы коллективного принятия решений с точки зрения «нейтрального» лица. В этой ситуации характеристики решения будут учитывать целевые функции всех игроков. Наиболее важными характеристиками принятия решения являются эффективность и устойчивость. Рассмотрим игру двух лиц с целевыми функциями:

Задача оптимизации рассматривается как многокритериальная (в данном случае — двухкритериальная) на множестве L=X×Z. Аргументом является вектор , а задача оптимизации (3.50) имеет вид обычной многокритериальной задачи оптимизации:

Для решения задачи (3.51) можно воспользоваться принципом Парето — важнейшим принципом построений ядра множества. Этот принцип позволяет отбросить все решения, которые могут быть заменены другими, обеспечивающими лучшие (в данном случае большие) значения целевых функций всех игроков одновременно или части игроков, но без уменьшения значения целевых функций остальных субъектов, участвующих в игре. Решения, которые не могут быть улучшены указанным образом назвали эффективными или Парето-оптимальными. Такие эффективные решения обладают тем свойством, что улучшить значение целевой функции одного из игроков можно только за счет других субъектов. Любое решение, находящееся вне множества Парето может быть улучшено сразу для всех игроков. В теории игр множество Парето называют «переговорным множеством». В нашем случае, выбор вектора осуществляется несколькими субъектами. Поэтому (3.51) является игрой, а не обычной многокритериальной задачей. Основным принципом принятия коллективного решения связан с понятиемустойчивости.

Будем называть точку устойчивым решением или точкой равновесия игры (3.50), если:

При выборе устойчивого решения , говорят что достигнута ситуация равновесия. Из данного определения следует, что неустойчивость ситуации проявляется возможностью одного из игроков, путем изменения своей стратегии, улучшить свое положение за счет других.

Такой принцип называется принципом Нэша (принцип устойчивости, или принцип равновесия). Согласно этому принципу выбор рациональной стратегии должен производится среди точек равновесия. Равновесные решения называют также оптимальными по Нэшу. Справедливо утверждение, чтов ситуации равновесия каждый из игроков получает выигрыш не меньший, чем соответствующий гарантированный максминный результат. Принцип Нэша позволяет сузить множество альтернатив, когда речь идет о коллективном решении, принимаемым всеми взаимодействующими субъектами по договоренности, при этом каждый поступается частью своих интересов.

Пусть имеется Nсубъектов, каждый из которых может выбирать свое решение (стратегию)так, чтобы максимизировать свой критерий.Значение критерия при этом зависит от выбора других субъектов, т. е.:

Решение называетсяравновесным, если для любогоkвыполняется условие:

Равновесное решение можно назвать устойчивым, так как если субъект kотступает от своего равновесного решения, т. е. выберет стратегиюто при условии, что остальные субъекты сохранят свой выбор, он проиграет. Следует отметить, что равновесные решения в общем случае не являются оптимальными и наоборот. Например, если решение принимается всеми субъектами независимо, то их выбор вряд ли будет устойчивым. Принцип Нэша эффективен при сужении множества альтернатив, когда равновесные решения одновременно принадлежат множеству Парето. Это бывает редко, чаще встречаются системы, в которых эффективные альтернативы являются неустойчивыми, а устойчивые — неэффективными. Поэтому одним из важных направлений теории ПР является изучение систем, в которых устойчивые точки принадлежат множеству Парето.

Рассмотрим пример. Пусть к нерегулируемому перекрестку едут под прямым углом, на высокой скорости два автомобиля. У водителя есть две стратегии:

1. Снизить скорость до безопасной (безопасная стратегия — стратегия Б).

2. Продолжать ехать на высокой скорости (рискованная стратегия — стратегия Р).

Если оба водителя будут придерживаться стратегии Б, то это приведет к благополучному исходу, оцениваемому для каждого водителя числом 1. Если оба водителя придерживаются стратегии Р, то происходит авария и потери каждого оцениваются отрицательным числом. (-9). Комбинации (Б,Р) или (Р,Б) оцениваются числом 0, для водителя снизившего скорость (за потерю времени) и числом 3, для двигающегося на высокой скорости (за экономию времени). Имеем следующую игру:

Таблица 3.4.

Соседние файлы в папке Диплом