Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР. Всё в 1 файле / Прикладные Инст сист.pdf
Скачиваний:
299
Добавлен:
15.09.2014
Размер:
1.43 Mб
Скачать

C(Ai , Aj ),если dk (Ai , Aj ) C(Ai , Aj ), k;

δ(Ai Aj ) = C(Ai , Aj ) 1dk (Ai , Aj ); j I * 1Ck (Ai , Aj )

Здесь I* – множество критериев, для которых dk (Ai , Aj ) > C(Ai , Aj ) .

Величину δ(Ai Aj ) можно интерпретировать как меру уверенности в справедливости

гипотезы о том, что Аi предпочтительнее Аj.

На этом этапе сначала определяется

Этап исследования альтернатив [12].

λ = max δ(Ai Aj ) . Устанавливается достаточно

близкий к λmax уровень, при котором

Ai , Aj

 

принимается гипотеза о превосходстве альтернативы Аi над Аj. Далее для каждой альтернативы Аi подсчитываются два индекса:

индекс «силы» – число альтернатив, доминируемых Аi;

индекс «слабости» – число альтернатив, доминирующих Аj.

Альтернативе Аi присваивается характеризующее ее число, равное разности индексов «силы» и «слабости».

Затем строится сверху вниз первый полный порядок альтернатив, аналогично тому, как делается в методе ELECTRE II. Альтернативы с наибольшим значением λ удаляются, для оставшихся опять выделяется ядро на основе подсчета тех же числе и т.д. Другой порядок определяется при подходе снизу вверх. На основе полных двух порядков строится средний, аналогично тому, как делается в методе ELECTRE II.

Лекция 20. Основные понятия и математическая модель игровых методов обоснования решений

20.1. Основные понятия теории игр

В практической деятельности часто приходится рассматривать явления и ситуации, в которых участвуют две или более стороны, имеющие различные цели и обладающие возможностями применять для достижения своих целей разнообразные действия. Такие ситуации принято называть конфликтными (или конфликтами).

Типичный конфликт характеризуется тремя основными составляющими:

1)заинтересованными сторонами,

2)возможными действиями сторон,

3)интересами сторон.

Примеры конфликтных ситуаций весьма многообразны: военные действия, экономика, судопроизводство, спорт и т.д.

Необходимость изучения и анализа таких ситуаций, представляемых в виде упрощенных математических моделей, вызвала к жизни специальный математический аппарат – теорию игр. Теория игр – это математическая теория конфликтных ситуаций.

Опишем некоторые понятия, используемые в этой теории.

Игра – это математическая модель конфликтной ситуации, возникающей при взаимодействии двух или более оперирующих сторон, которые имеют несовпадающие интересы. Заинтересованные стороны называются игроками, исход конфликта (результат игры) – выигрышем.

От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Правила – это система условий, которые определяют:

возможные варианты действий игроков,

96

объем информации каждой стороны о поведении другой,

результат (исход) игры, к которому приводит каждая совокупность действий.

Игра носит название антагонистической, если число игроков равно двум, а выигрыш одного из игроков равен проигрышу другого (игра с нулевой суммой).

Ходом в теории игр называется выбор одно из предусмотренных правилами игры действий и его осуществление.

Стратегия игрока – это совокупность правил, определяющих выбор варианта действий при каждом ходе игрока в зависимости от ситуации, сложившейся в ходе игры.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает игроку максимально возможный средний выигрыш (минимально возможный средний проигрыш).

20.2. Математическая модель игры

Рассмотрим игру, в которой игрок А имеет т стратегий: А1, А2,…, Ат, а игрок В п стратегий: В1, В2,…, Вп.

Пусть игрок А выбрал стратегию Аi, а игрок В – стратегию Вk. Будем считать, что выбор игроками стратегий Аi и Вk однозначно определяет исход игры – выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

bik = аik.

Последнее условие показывает, что выигрыш одного из игроков равен выигрышу другого, взятому с противоположным знаком. Поэтому при анализе такой игры можно рассматривать выигрыши только одного из игроков. Пусть это будут выигрыши игрока А.

Если нам известны значения аik выигрыша при каждой паре стратегий {Аi, Вk}, i = 1, 2,... m, k = 1, 2, …, п, то их удобно записывать

или в виде прямоугольной таблицы, строки которой соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В,

 

 

 

 

 

 

 

 

 

В1

В2

Вп

 

 

 

 

 

 

 

А1

 

а11

а12

а1п

 

 

 

 

 

 

 

А2

 

а21

а22

а2п

 

 

 

 

 

 

 

 

. . . .

. . . . . . . . . . . .

 

 

 

 

 

 

 

Ат

 

ат1

ат2

атп

или в виде матрицы

 

 

 

 

 

 

 

a11 a12

... a1n

 

 

 

 

А =

a

21

a

22

... a

2n

 

 

 

 

 

 

 

 

.

 

 

 

 

.....................

 

 

 

 

 

 

am1 am2 ... amn

 

 

 

Полученная матрица имеет размер т х п и называется матрицей игры или платежной матрицей. Рассматриваемую игру называют т х п или т х п – игрой.

Пример 20.1. Каждый из двух игроков А и В одновременно и независимо записывают на листе бумаги любое целое число. Если записанные числа имеют разную четность, то игрок А получает от игрока В 1 руб., а если одинаковую, то, наоборот, игрок А платит игроку

В1 руб.

Уигрока А две стратегии: А1 – записать четное число и А2 – записать нечетное число.

У игрока В такие же две стратегии: В1 – записать четное число и В2 – записать нечетное число.

97

Выбор игроками соответственно стратегий Аi и Вk однозначно определяет исход игры:

аik – выигрыш игрока А.

Матрица (2 х 2)-игры имеет следующий вид:

11 11 .

В этой матрице строки соответствуют стратегиям игрока А, а столбцы – игрока В.

20.3. Нижняя и верхняя цена игры. Принцип минимакса

Рассмотрим произвольную матричную игру:

a11 a12 ... a1n

А= a21 a22 ... a2n

.....................

am1 am2 ... amn

иопишем алгоритм, с помощью которого можно определить наилучшую стратегию [5,28]. В теории игр предполагается, что оба игрока действуют разумно, т.е. стремятся к

получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом.

Действия игрока А.

1-й шаг. В каждой строке матрицы А находится минимальный элемент

αi = min аik, i = 1, 2,... m.

k

Полученные числа

α1, α2,…, αт

приписываются к заданной таблице в виде правого добавочного столбца:

 

 

а11

а12

а1п

α1

 

 

 

а21

а22

а2п

α2

 

 

. . .

. . .

. . .

. . .

. . .

 

 

 

ат1

ат2

атп

αт

 

Выбирая стратегию Аi, игрок

А должен рассчитывать на то, что в результате разумных

действий игрока В он выиграет не меньше, чем αi.

 

 

 

2-й шаг. Среди чисел

 

 

 

 

 

α1, α2,…, αт

 

 

 

 

 

выбирается максимальное число

 

 

 

 

 

α = max αi,

 

 

 

 

 

 

i

 

 

 

 

 

или α = max min аik.

 

 

 

 

 

i

k

 

 

 

 

 

Выбранное число α является одним из элементов заданной матрицы А.

Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок А должен остановиться на той стратегии Аi, для которой число αi является максимальным.

Если игрок А будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока В игроку А гарантирован выигрыш, не меньший α.

Число α называется нижней ценой игры.

Принцип построения стратегии игрока А, основанный на максимизации минимальных выигрышей, называется принципом максимина, а выбираемая в соответствии с эти принципом стратегия Ai0 максиминной стратегией игрока А.

98

Действия игрока В.

1-й шаг. В каждой строке матрицы А находится максимальный элемент

βk = max аik, k = 1, 2, …, п.

i

Полученные числа

β1, β2,…, βп

приписываются к заданной таблице в виде нижней добавочной стоки:

а11

а12

а1п

α1

а21

а22

а2п

α2

. . .

. . .

. . .

. . .

. . .

ат1

ат2

атп

αт

β1

β2

βп

 

Выбирая стратегию Вk, игрок В должен рассчитывать на то, что в результате разумных

действий игрока А он проиграет не больше, чем βk. 2-й шаг. Среди чисел

β1, β2,…, βп

выбирается минимальное число

β = min βk, k

или β = min max аik. k i

Выбранное число β является одним из элементов заданной матрицы А.

Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок В должен остановиться на той стратегии Вk, для которой число βk является минимальным.

Если игрок В будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока А игроку В гарантирован выигрыш, не больший β.

Число β называется верхней ценой игры.

Принцип построения стратегии игрока В, основанный на минимизации максимальных потерь, называется принципом минимакса, а выбираемая в соответствии с эти принципом стратегия Вk 0 минимаксной стратегией игрока В.

Нижняя цена игры α и верхняя цена игры β всегда связаны неравенством α ≤ β. Если α = β, или

max min аik = min max аik.

i k

k i

то ситуация ( Ai0 , Вk 0 ) оказывается равновесной и ни один из игроков не заинтересован

втом, чтобы ее нарушить.

Втом случае, когда нижняя цена игры равна верхней цене игры, их общее значение называется чистой ценой игры и обозначается через ν.

Цена игры совпадает с элементом aiok o матрицы игры А, расположенным на пересечении io-й строки (стратегия Ai0 игрока А) и ko-го столбца (стратегия Вk 0 игрока В), –

минимальным в своей строке и максимальным в своем столбце.

Этот элемент называют седловой точкой матрицы А или точкой равновесия, а про игру говорят, что она имеет седловую точку.

Стратегии Ai0 и Вk 0 , соответствующие седловой точке, называются оптимальными, а

совокупность оптимальных ситуаций и цена игры – решением матричной игры с седловой точкой.

99