Теория принятия решений / pdf / Dec_make4
.pdfснижают эффективность управления. Ответственность за результаты принятого решения означает, что в обязанности ЛПР входит не только непосредственное принятие решения, но и несение определенной ответственности за результаты его реализации. Следование этому требованию повышает уровень реализуемости принятых решений.
9.2. Элементы теории эвристических решений (ЭР)
9.2.1. Строгие и эвристические методы принятия решений
Среди методов принятия решений выделяют два основных вида: строгие и эвристические методы. Эффективное использование компьютеров для решения научнотехнических задач основано, главным образом, на ряде допущений, упрощающих представления о моделируемых реальных процессах. Такое абстрагирование позволяет подобрать для рассматриваемого физического процесса адекватную математическую модель, разработать на этой основе соответствующие алгоритмы, составить программу и с помощью компьютеров получить приемлемое решение. Существенный момент в таком способе решения – простота моделируемого процесса, однозначность решения и точное знание степени его применимости.
Но в ряде случаев трудно, а иногда и невозможно построить адекватную математическую модель исследуемого процесса, что связано с его сложностью, отсутствием необходимой и достаточной информации. При этом всякое упрощение такого процесса, его идеализация, попытка абстрагирования для использования подходящего математического аппарата часто выхолащивает сущность исследуемого процесса и снижает ценность результата.
Между тем человек, встречаясь в своей повседневной практике с подобными задачами, решает их без применения сложных математических средств и без достаточного количества текущей информации. Более того, иногда принимаемые им решения оказываются лучше и эффективнее решений, полученных с помощью математических методов. Эти соображения выдвигают необходимость разработки качественно новых методов решения задач с помощью компьютеров путем моделирования отдельных сторон процесса творческого мышления человека, методов, обеспечивающих эффективное решение особо сложных задач, в частности, в условиях неполной текущей информации. Такие задачи возникают в экономике, медицине, при исследовании Космоса, где мы имеем дело с функционированием систем, зависящих от многих разнообразных переменных.
Методы решения таких задач в условиях, когда из-за их сложности и недостаточности информации нельзя точно очертить границы их применимости и оценить допустимые ошибки, называются эвристическими.
Эвристические методы предполагают изучение принципов переработки информации, осуществляемой человеком на различных этапах его деятельности при решении конкретной задачи, и построение на этой основе программ, реализуемых на ЭВМ. Этот процесс –
эвристическоепрограммирование.
Характерная особенность эвристического программирования – широкое изучение приемов работы человека при решении задач в условиях неполной информации, накопление особенностей о процессах решения аналогичных задач (формирование опыта) и моделирование всегопроцесса переработки информации человеком путемрасчленения егона такназываемыеэлементарныеинформационныепроцессы.
124
Поскольку в основе эвристических методов лежит процедура поиска, эвристическое программирование иногда обеспечивает решение задачи в условиях неопределенности. Однако после выбора перспективного направления следует строгое решение, которое и приводит к окончательному результату. Именно сочетание обоих методов (эвристического и строгого) обусловливает эффективность рассматриваемого процесса в рамках конкретной человеческой деятельности.
Нет резкой и четкой границы между эвристическими и строгими методами. Более того, по мере развития науки многие эвристические методы решения формализуются, приобретают необходимую строгость и переходят в класс строгих. Пример: решение задач кавалером де Мере (XVII в.), эвристические приемы, интуиция которого по отгадыванию очков при игре в кости базировались на наблюдениях. Создание теории вероятностей позволило формализовать этот процесс отгадывания, дало ему количественную оценку. (Задача кавалера де Мере: что вероятнее, при одном бросании четырех игральных костей хотя бы на одной получить единицу или при 24 бросаниях двух игральных костей хотя бы один раз получить две единицы.)
Вся история науки повторяет приведенную схему:
1.накопление и систематизация знаний,
2.выработка "чутья" (интуиции),
3.формализация процесса,
4.алгоритм принятия решения.
Это не означает, что эвристические методы исчерпали себя: с расширением круга наших знаний неизбежно расширяется и область вновь возникающих проблем.
9.3. Общая структура процесса принятия решения
Рассмотрим по Л.Д. Фогелю три типа решений, принимаемых человеком: дедуктивные, абдуктивные, индуктивные.
1. Дедуктивные решения (ДР) (deductio – выведение), входящие в класс строгих, отличаются полной определенностью. ДР представляют собой процесс выведения некоторого заключительного утверждения (следствия) из одного или нескольких исходных утверждений, посылок по некоторому правилу, закону (например, в соответствии с законами логики). Обычная функциональная зависимость, когда по заданному значению аргумента xi и оператору R определяется значение функции
yi = R(xi),
является примером ДР. Дедуктивные решения охватывают широкий класс преобразований, осуществляемых в технике, природе и обществе. При ДР теоретически возможно по заданным операторам и известным значениям входов определить выходные реакции. ДР достаточно подробно описаны в специальной литературе (теория автоматического регулирования, теория конечных автоматов и др.).
2. Абдуктивные решения (АР) (abducere – отводить) входят как в класс строгих, так и в класс эвристических решений и отличаются большой неопределенностью. АР представляют собой процесс выявления наиболее вероятных исходных утверждений (посылок, причин) из некоторого заключительного утверждения на основе обратных преобразований. АР строятся на основе использования прошлого опыта. Пусть, например, между некоторыми множествами посылок xi(xi X) и следствий yi(yi Y) обнаружена причинно-следственная связь R. Тогда наиболее вероятной причиной появления нового следствия yi (yi Y) является
125
посылка
xi = R–1(yi).
Если оператор R известен, то известен и обратный оператор R–1, и абдуктивное решение является строгим. АР часто встречается в науке и повседневном опыте. Пример: определение температуры тела t по длине столбика ртути в термометре l. Установлен физический закон: l = R(t), в практике: t = R-1 (l). Другие примеры: анализ хозяйственной деятельности предприятия, изучение космических лучей (наблюдаем следствие Y, находятся исходные посылки, причины X).
3. Индуктивные решения (ИР) (inductio – наведение, побуждение) входят в класс эвристических решений, отличаются большой неопределенностью. ИР представляют процесс выявления наиболее вероятных закономерностей, связей, действий, существующих между исходными утверждениями. ИР выявляют оператор R по входным xi и выходным yi сигналам,
yi = R(xi).
ИР наиболее свойственно мышлению. Ребенок, поставив перед собой задачу построить домик yi из кубиков xi, предпринимает некоторые действия R, yi = R(xi). К этой же категории решений относятся действия врача при лечении больного, руководителя организации при выполнении задания. Выявляемый этим способом оператор R неоднозначен, при его определении возможен некоторый произвол, уменьшающийся по мере накопления опыта и рассмотрения решения на нескольких уровнях.
Мозг рассматривается как самоорганизующаяся система и считается, что в его основе лежит иерархия соподчиненных алгоритмов, в которой выделяют три уровня:
нижний – уровень систем условных и безусловных рефлексов, средний – уровень системы правил процесса обучения,
высший – уровень, формирующий и корректирующий предыдущий уровень. Эвристические способности человека – результат одновременного обобщения
данного события на различных уровнях. При этом решение, полученное на более высоком уровне, доминирует над решением более низкого уровня, отбрасывая его, если оно оказывается неверным, и направляя усилия на поиски новых решений.
Пример: дана последовательность
1, 2, 3,… .
Найти следующую цифру этой последовательности. Если эта цифра 4, то имеем
1, 2, 3, 4, ...,
последовательность целых чисел. Но если будет сообщение "неверно", то возможно решение 1, 2, 3, 5, ..., последовательность простых чисел.
Живой организм использует абстракцию того уровня, который порождает модель, адекватную ситуацию, в которой он находится.
Важное значение в теории ЭР имеет исследование элементарных информационных процессов (ИЭИП) на разных уровнях. ИЭИП – факторизация, дробление, программирование мыслительного процесса. Главная задача этого исследования – выявление правил объединения элементарных информационных процессов в сложные программы. Эти исследования исходят из предположения о возможности изучения работы мозга с различной степенью детальности, что соответствует описанию информационных процессов на разных уровнях.
Иерархия соподчиненных алгоритмов головного мозга позволяет выделить правила переработки информации, которые обеспечивают формирование целесообразного поведения живого организма при изменении среды. При более детальном рассмотрении внешней среды и ее связей с живым организмом возможно
126
построение формальной модели эвристической деятельности – теории поиска в абстрактном лабиринте, постановки проблемы отбора достоверной и непротиворечивой информации, непосредственно связанной с целью. При этом рассматриваются не только процессы, происходящие в мозге, но и те изменения, которые происходят во внешней среде в результате активных действий живого организма (прямая и обратная связь). Такой подход позволяет моделировать отдельные аспекты мышления при решении конкретных задач, выявлять новые закономерности высшей нервной деятельности.
Дадим схематическую классификацию рассмотренных видов решений.
|
|
|
|
|
|
ТР |
|
|
|
Дедуктивные |
Абдуктивные |
Индуктивные |
|||||||
решения ДР |
решения АР |
решения ИР |
|||||||
Теория |
|
строгих решений |
|
|
|
Теория эвристических решений |
|||
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9.4. Центральная проблема теории ЭР
Центральное место в теории ЭР занимает проблема опознавания ситуаций и явлений окружающего мира, представляющая собой обобщение частных проблем распознавания образов (РО).
Суть этих проблем:
1)живому организму генетически передается наследственная информация только в общих чертах с чрезвычайно малой степенью организации мозга;
2)в дальнейшем при активном общении с внешней средой тем или иным способом (обучения, проб и ошибок и пр.) происходит некоторая организация мозга, накопление опыта. Эти соображения о работе головного мозга обычно кладутся в основу устройств, предназначенных для РО. Отметим общие черты функционирования устройств по распознаванию образов:
1.Устройство (первоначально с помощью извне, например человека) обеспечивает разбиение рассматриваемых объектов на классы (множества похожих объектов). Сведения о том, по какому принципу в данной задаче необходимо осуществить разбиение на классы, устройство выявляет самостоятельно, обобщая отдельные примеры, предъявляемые ему на стадии "обучения".
2.В процессе "экзамена" устройство производит классификацию новых объектов, а высокая оценка ("поощрение", производимое извне) улучшает классификацию.
Положительное решение этой проблемы связано с решением многих актуальных проблем нашего времени (медицинской и технической диагностики, образования понятий и т.д.).
127
10.ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ. ТЕОРИЯ ИГР
10.1. Предмет и задачи теории игр
Подавляющее большинство социально-экономических решений приходится принимать с учетом противоречивых интересов, относящихся либо к различным лицам или организациям, либо к различным аспектам рассматриваемого явления, либо к тому
идругому. В таких случаях невозможно применить традиционные методы оптимизации. В обычных экстремальных задачах речь идет о выборе решения одним лицом, и результат решения зависит от этого выбора, то есть определяется действиями только одного лица. В такую схему не укладываются ситуации, где решения, оптимальные для одной стороны, совсем не оптимальны для другой и результат решения зависит от всех конфликтующих сторон.
Конфликтный характер таких задач не предполагает вражды между участниками, а свидетельствует о различных интересах. Необходимость анализировать подобные ситуации вызвала к жизни специальный математический аппарат - теорию игр.
Теория игр представляет собой часть обширной теории, изучающей процессы принятия оптимальных решений. Она дает формальный язык для описания процессов принятия сознательных, целенаправленных решений с участием одного или нескольких лиц в условиях неопределенности и конфликта, вызываемого столкновением интересов конфликтующих сторон. Неопределенность может быть вызвана не только стремлением противников скрыть свои действия в игре, но и дефицитом информации и данных о рассматриваемом явлении. В этом случае можно говорить о конфликте человека с природой.
Целью теории игр является выработка рекомендаций по рациональному образу действий участников в конфликтных ситуациях, то есть определение оптимальной стратегии каждого из них.
Первые работы по ТИ (Цермело, Борель, фон Нейман) относятся к началу ХХ века. Но только появление и широкое распространение ЭВМ привлекло к ТИ внимание широкого круга специалистов.
Теория стратегических игр в своей математической форме возникла в 30-х годах нашего века. Ее создателем считается Джон фон Нейман. Первой фундаментальной книгой по теории игр была изданная в 1944 году работа "Теория игр
иэкономическое поведение" (Нейман Д., Моргенштерн О. М.:Наука,1970)
Практическое значение ТИ состоит в том, что она служит основой моделирования игровых экспериментов, в частности, деловых игр, позволяющих определять оптимальное поведение в сложных ситуациях. В принципе, возможно описание военных, правовых конфликтов, спортивных состязаний, "салонных" игр и явлений в биологии, связанных с борьбой за существование.
От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Реальные конфликты обычно трудно поддаются формальному описанию, поэтому любая игра является упрощением исходной задачи, в ней отражаются лишь основные, первостепенные факторы, отражающие суть процесса или явления.
В зависимости от того, какими данными располагает исследователь, и какую задачу он перед собой ставит, могут быть сформулированы различные теоретикоигровые модели. Различают три основных типа задач:
128
1.Нахождение оптимального исхода. В качестве исхода в общем случае может рассматриваться социально-экономическая ситуация. В зависимости от содержания задачи ситуацию можно описать наборами благ, получаемых каждым игроком (выигрышами), или исходом может быть избрание того или иного кандидата, принятие того или иного проекта, договора и т.д. При этом в общем случае надо найти коалиционную структуру и коалиционные стратегии, при которых оптимальный исход реализуется.
2.Нахождение оптимального исхода при фиксированной коалиционной структуре, то есть когда нам заведомо известно, что, например, образование коалиций запрещено, невозможно или имеющаяся коалиционная структура не должна меняться по каким-либо политическим или экономическим соображениям. В этом случае общей задачей является нахождение правил принятия решений в коалициях (порядок вознаграждения ее членов), при которых данная коалиционная структура не распадется, и, значит, система будет функционировать согласно интересам и возможностям ее участников.
3.Нахождение устойчивой коалиционной структуры при заданных правилах принятия решений (конституции, нормативных актах, уставе предприятия и др.) в коалициях. Такие задачи часто встречаются при решении экономических и социальных проблем.
Формализованные модели конфликтов известны с давних пор: это игры в буквальном смысле слова - шахматы, карты, кости и т.п. Эти игры носят характер соревнования, протекающего по известным правилам. Терминология, заимствованная из практики таких игр, применима и для других конфликтных ситуаций, которые рассматривает теория игр.
Игрой называется всякая конфликтная ситуация, изучаемая в теории игр и представляющая собой упрощенную, схематизированную модель ситуации.
От реальной конфликтной ситуации игра отличается тем, что не включает второстепенные, несущественные для ситуации факторы и ведется по определенным правилам, которые в реальной ситуации могут нарушаться
Всякая игра включает в себя три элемента: участников игры - игроков, правила игры, оценку результатов действий игроков.
Г = < I, {x}, {H} > = < игроки, стратегии, выигрыши >
Игроком (лицом, стороной, или коалицией) называется отдельная совокупность интересов, отстаиваемая в игре. Если данную совокупность интересов отстаивает несколько участников игры, то они рассматриваются как один игрок. Игроки, имеющие противоположные по отношению друг к другу интересы, называются противниками.
Вигре могут сталкиваться интересы двух или более противников.
Стратегии - доступные для игроков действия, в общем случае - это набор правил и ограничений.
Ситуации - возможные исходы конфликта. Каждая ситуация - результат выбора каждым игроком своей стратегии.
Стратегические игры - игры, в которых конфликт отражает интересы активных участников, то есть таких, которые оказывают влияние на выбор стратегий и ситуацию.
Антагонистические игры
Игра Г = <X,Y,H>, где X,Y - непустые множества стратегий соответственно первого и второго игроков, H - функция выигрыша, причем Н1 = -Н2, называется антагонистической.
129
Впроцессе игры каждый игрок выбирает свою стратегию, в результате чего образуется ситуация (x,y), которой соответствует выигрыш Н(x,y) для первого игрока и
-Н(x,y) для второго.
Вмножестве всех возможных антагонистических игр выделяются классы аффинно-эквивалентных игр.
Две антагонистические игры Г = <X,Y,H> и Г’ = < X’,Y’,H’>, называются
аффинно-эквивалентными, если X = X’, Y = Y’ и H’ = k H + a, где а - вещественное, а k > 0. В этом случае используется обозначение Г Г’.
Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы - стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.
10.2. Ситуации равновесия (седловые точки)
Вкачестве цели при поиске решения антагонистической игры будем рассматривать ситуацию равновесия, то есть устойчивое и выгодное решение.
Вматричных играх ситуация i*, j* называется приемлемой для первого игрока,
если a ij* ≤ ai*j* и приемлемой для второго игрока, если ai*j* ≤ a i*j.
Таким образом, всякое отклонение от приемлемой ситуации уменьшает выигрыш первого игрока и увеличивает проигрыш второго.
Ситуация (i*, j*) называется равновесной, если она приемлема для обоих игроков a ij* ≤ ai*j* ≤ a i*j . Применительно к антагонистическим играм говорят о седловых точках на поверхности выигрыша (на них достигается max по первой координате и min по второй.
10.2.1. Свойства седловых точек:
1.Равноценность. Если в игре несколько седловых точек, то значения функции выигрыша в них одинаковы.
2.Взаимозаменяемость оптимальных стратегий. Игроки могут заменить свои оптимальные стратегии другими оптимальными стратегиями, при этом равновесие не нарушится, а выигрыш (проигрыш) останется неизменным.
Теорема. Аффинно-эквивалентные игры имеют одни и те же седловые точки (то есть, их решения совпадают).
10.2.2. Седловые точки и минимаксы
Устойчивое решение игры может быть получено путем следующих рассуждений.
В самом неблагоприятном случае выигрыш первого игрока не может быть уменьшен по вине противника, если он удовлетворяет условию:
a ij* = min аij
С другой стороны, руководствуясь принципом выгодности первый игрок будет стремиться увеличить свой выигрыш, сохраняя свойство устойчивости, поэтому
130
vн = max min аij.
Это нижняя цена игры. Рассуждая подобным образом за второго игрока, получим верхнюю цену игры:
vв = min max аij.
Интуитивно ясно, что значение (цена) игры лежит между vн и vв.
Теорема. Для того, чтобы в матричной игре существовали минимаксы, необходимо и достаточно, чтобы они были равны максиминам другого игрока:
max min аij = min max аij
10.3. Оптимальные смешанные стратегии и их свойства
Если матричная игра не имеет седловой точки (ситуации равновесия), то ее решение в чистых стратегиях становится непредсказуемым: каждому игроку можно только гарантировать, что его выигрыш при разумном поведении будет не менее нижней границы и не более верхней границы цены игры.
Матричная игра без седловой точки приводит к неустойчивости использования стратегий при многократном повторении игры.
Смешанной стратегией игрока в матричной игре называется полный набор вероятностей x = (x1, x2 ... xm) и y = (y1, y2 ... yn) применения его чистых стратегий (чистые стратегии - исходные).
Свойства смешанных стратегий
1 свойство. Если x" = (x1, x2, ... xm) и y" = (y1, y2,...yn) - оптимальные смешанные стратегии игроков в матричной игре, то для произвольных стратегий x и y справедливо
Н(А, x", y) = ∑ aij xi" ≥ v для всех j =1 : n, так как это равносильно использованию вторым игроком чистой j-той стратегии: y = (0, 0,...yj = 1,... 0, 0)
Н(А, x, y") = ∑ aij yj" ≤ v для всех i = 1 : m, так как это равносильно
использованию первым игроком чистой i-той стратегии: x = (0, 0,...xi = 1,... 0, 0).
2 свойство. Если в матричной игре с матрицей А и ценой игры v стратегии x" и y" - оптимальные, то
если ∑ aij xi" > v, то yj" = 0 если ∑ aij yj" < v, то xi" = 0
если неравенства обращаются в равенства, то соответственно: xi" ≠ 0, yj" ≠ 0.
На приведенных свойствах основано решение матричных игр в смешанных стратегиях.
10.4. Доминирование в матричных играх
Решение в матричных играх, особенно если матрица большая, получается путем громоздких вычислений и преобразований. Поэтому необходимо по возможности сократить матрицу и упростить решение, не в ущерб результату. В качестве такого сокращения используется понятие доминирования стратегий.
Пусть задана матричная игра с платежной матрицей А, а смешанные стратегии игроков представлены в виде x = (x1, x2,... xm) и y = (y1, y2,... yn). Вектор х' строго доминирует вектор х"( вектор x" строго доминируется вектором x'), если справедливо: xi' > xi", i = 1 : m. Если неравенство нестрогое, то и доминирование является нестрогим.
131
Теорема. Если строка с номером r в матрице А строго доминируется выпуклой линейной комбинацией всех остальных строк, то она входит с нулевой вероятностью в любую оптимальную смешанную стратегию первого игрока.
Если x~, y~- пара оптимальных смешанных стратегий игры с матрицей A, то удалив из вектора x~ нулевую координату с номером r получим пару оптимальных смешанных стратегий x`~, y~ игры с матрицей A`, полученной из матрицы A вычеркиванием строки с номером r.
Обратное утверждение тоже верно. Если x`~, y~- пара оптимальных смешанных стратегий игры с матрицей A`, то добавив в качестве r-той координаты вектора x`~ ноль и сдвинув на одно место вправо все координаты вектора x~ с номерами r, r + 1... m - 1, получим пару оптимальных смешанных стратегий x~, y~ игры с матрицей A.
Теорема. Если строка с номером r в матрице А нестрого доминируется выпуклой линейной комбинацией всех остальных строк, то существует оптимальная смешанная стратегия первого игрока x~, у которой r-тая координата равна нулю.
Любая пара x`~, y~ оптимальных смешанных стратегий игры с матрицей А` преобразуется в пару оптимальных смешанных стратегий x~, y~ игры с матрицей А добавлением нулевой координаты с номером r в вектор x`~ и сдвигом координат этого вектора с номерами r, r + 1,...m - 1 на одно место вправо.
Во всех этих случаях значение игры с матрицей А совпадает со значением игры с матрицей А~.
Теорема. Если столбец с номером s в матрице А строго доминирует выпуклую линейную комбинацию всех остальных столбцов, то он входит с нулевой вероятностью в любую оптимальную смешанную стратегию второго игрока.
Если x~, y~ - пара оптимальных смешанных стратегий в игре с матрицей А, то, удалив из вектора y~ нулевую координату с номером s, получим пару оптимальных смешанных стратегий x~,y`~ игры с матрицей A`, полученной из матрицы А вычеркиванием столбца с номером s.
Обратное: если x~,y`~ - пара оптимальных смешанных стратегий игры с матрицей A`, то, добавив в качестве координаты с номером s вектора y`~ ноль и сдвинув все координаты с номерами s, s + 1,... n-1 на одно место вправо, получим пару x~,y~ оптимальных смешанных стратегий в игре с матрицей А.
Теорема. Если столбец с номером s в матрице А нестрого доминирует выпуклую линейную комбинацию всех остальных столбцов, то существует такая оптимальная смешанная стратегия y~ второго игрока, в которой координата с номером s равна нулю, и любая пара x~, y`~ оптимальных смешанных стратегий игры с матрицей А` преобразуется в пару оптимальных смешанных стратегий x~, y~ игры с матрицей А добавлением нулевой s-той координаты и сдвигом координат с номерами s, s+1,... n-1 вектора y`~ вправо на одно место.
Таким образом, если строка матрицы А доминируется какой-либо другой (то есть она меньше) или линейной выпуклой комбинацией всех остальных строк, то ее можно вычеркнуть и решать задачу с меньшей матрицей, а решение исходной задачи получить добавив нули вместо недостающих координат в векторе первого игрока.
Если столбец матрицы А доминирует какой-либо другой (то есть он больше) или выпуклую линейную комбинацию всех остальных столбцов, то ее можно вычеркнуть, решить игру с меньшим количеством столбцов и получить оптимальные смешанные стратегии добавлением нулей вместо недостающих координат в векторе второго игрока.
132
10.5. Метод приближенного определения цены игры
Способ отыскания приближенного решения прямоугольных игр был сформулирован в работе Г.В.Брауна, а сходимость процесса была доказана Джулией Робинсон в 1951 году.
Этот метод, называемый еще итеративным, опирается на традиционный статистический принцип: основывать будущие решения на соответствующей предыстории.
Заключается он в последовательной процедуре "сближения" верхней и нижней цены игры с заданной точностью.
Биматричные игры
Функция выигрыша биматричной игры представляет собой две платежные матрицы: А - определяет выигрыш первого игрока, а В - выигрыш второго игрока. Первый игрок имеет m чистых стратегий (m строк в матрицах А и В). Второй игрок имеет n чистых стратегий (n столбцов в матрицах А и В).
Врезультате выбора первым игроком i-той стратегии, а вторым игроком j-той стратегии, первый игрок получает выигрыш aij, а второй - bij .
Решение биматричных игр сводится к отысканию ситуаций равновесия и равновесных (оптимальных) стратегий игроков.
Вбиматричной игре ситуация i*j называется приемлемой для первого игрока, если его выигрыш в этой ситуации не меньше, чем в любой другой:
аi*j |
≥ аij |
j=1:n. |
Для второго игрока ситуация ij* приемлема, если его выигрыш в этой ситуации |
||
не меньше, чем в любой другой: |
||
bi*j |
≥ bij |
i=1:m. |
Tаким образом, приемлемые ситуации для первого игрока - это максимальные элементы в столбцах матрицы А, а для второго игрока - максимальные (тоже!) элементы в строках матрицы В.
Ситуация i*j* в биматричной игре называется равновесной, если она приемлема для обоих игроков, то есть если любое отклонение от нее как для первого игрока, так и для второго только лишь уменьшает их выигрыш:
аi*j* ≥ аij*
bi*j* ≥ bi*jю
Множество ситуаций равновесия G образуется как пересечение множеств
приемлемых ситуаций первого и второго игроков. |
|
|
|
||||
Пример. |
3 |
0 |
2 |
|
3 |
1 |
0 |
|
|
||||||
А: |
1 |
2 |
0 |
В: |
2 |
0 |
2 |
|
0 |
3 |
2 |
|
0 |
2 |
1 |
G1={(1,1),(1,3),(3,2),(3,3)} |
|
|
|
|
|
|
|
G2={(1,1),(2,1),(2,3),(3,2)} |
|
G = {(1,1),(3,2)} |
|
|
|
||
I v(1,1) = 3 |
II v(1,1)= 3 |
|
|
|
|
||
v(3,2) = 3 |
v(3,2)= 2 |
|
|
|
|
|
|
Таким образом, если в биматричной игре несколько равновесных ситуаций, то по выгодности они не равнозначны, в отличие от матричных игр.
Из примера хорошо видно, что хотя (1,1) и (3,2) - ситуации равновесия, ситуации (1,2) и (3,1) таковыми не являются, в отличие от матричных игр.
133
