Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ekzamen_po_RUR (2).doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
368.64 Кб
Скачать

1. Оптимальное решение. Критериальная функция.

Оптимальность – наилучший вариант ПР. Критерий – значимая, понятная ЛПР, хорошо им интерпретируемая характеристика исхода принятого решения.

Ситуацию мы измеряем при помощи критериев. F = зависимость от факторов = критериальная функция. Могут быть одно (монокритериальные, скалярные) и многокритериальные (критерии, которые должны быть достигнуты одновременно – поликритериальные или векторные).

2. Парная антагонистическая игра: формальное описание.

Парная игра разыгрывается между двумя игроками. Будем именовать их игрок 1 и игрок 2. Кроме того, условимся в дальнейшем, выступая в роли ЛПР, рассуждать и действовать на стороне игрока 1; при этом игрок 2 будет выступать в роли «противника».

Обозначим через X и Y множества возможных стратегий игрока 1 и игрока 2 соответственно. Величины x Є X и y Є Y будут обозначать конкретные стратегии игроков 1 и 2. Каждая конкретная стратегия игрока представляет собой некоторую совокупность указаний, определяющих последовательность его личных ходов в некоторой конкретной партии игры.

Игра может содержать, кроме личных ходов, и случайные ходы. Обозначим через H множество случайных стратегий. Любая конкретная стратегия hЄH представляет собой некоторую последовательность всех случайных ходов в некоторой конкретной партии игры. Каждая конкретная стратегия h будет происходить с некоторой вероятностью P(h), которая может быть подсчитана на основании вероятностей каждого случайного хода в этой последовательности; последние задаются правилами игры.

Функция P(h) представляет собой распределение вероятностей на пространстве H и должна удовлетворять условиям:

P(h) ≥ 0, (3.1)

Обозначим через g некоторый конкретный вариант игры, то есть некоторую индивидуальную партию игры. Каждая партия игры будет определена, если выбраны стратегии игроков 1 и 2, то есть xЄX и yЄY, и стратегия случайных ходов hЄH. Следовательно, всякая конкретная партия g игры определяется тремя элементами x, y, h.

Будем условно обозначать конкретную партию игры в виде

g = (x, y, h) (3.2)

Результатом партии игры является выигрыш (или проигрыш) каждого из игроков. Этот результат не всегда имеет количественное выражение. Однако для получения количественных оценок принимаемых решений результат игры необходимо хотя бы условно, представить числом (например, выигрыш – 1, проигрыш – 0, ничья – 0,5).

Рассмотрим одну из конкретных партий игры g = (x, y, h) и обозначим через L1 (x, y, h) и L2 (x, y, h) величины проигрыша первого и второго игрока соответственно. Условимся проигрышу приписывать знак «+», а выигрышу –

«-», то есть выигрыши рассматривать как отрицательные проигрыши. Общая сумма L(x, y, h) проигрышей обоих игроков в партии g = (x, y, h) равна

L(x, y, h) = L1 (x, y, h) + L2 (x, y, h) (3.3)

В парной антагонистической игре общая сумма проигрышей L(x, y, h) равна нулю: проигрыш одного игрока – выигрыш другого.

Проигрыш игрока 2 в теории игр называется потерями. С их помощью оценивают результат игры. Обозначим потери как L (x, y, h). Очевидно, что

L (x, y, h) = L2 (x, y, h) = - L1 (x, y, h) (3.4)

Поскольку стратегия h является случайной, то при выбранных стратегиях x и y игроков 1 и 2 потери L (x, y, h) будут случайной величиной с распределением вероятностей P(h) на множестве H случайных стратегий. Чтобы оценить выбранные стратегии x и y игроков на бесконечном множестве партий игры, прибегнем к приему усреднения потерь L (x, y, h) по всему множеству случайных стратегий H, для чего введем понятие средних потерь Lср(x, y), определяемых по формуле для математического ожидания случайной величины:

Lср (x, y) = (3.5)

Лиля, наверное, тут надо остановиться

Функция Lср (x, y) в теории игр называется функцией средних потерь или просто функцией потерь. Очевидно, что при многократном повторении партий игры с одними и теми же конкретными стратегиями x и y игроков суммарный проигрыш игрока 2 (а значит и суммарный выигрыш игрока 1) стремится к величине функции средних потерь Lср (x, y). В этом смысле последняя является характеристикой качества стратегий игроков (результат игры как бы «очищается» от влияния случайных стратегий h Є H).

В теории игр принято считать, что парная антагонистическая игра формально определена, если перечислены все возможные стратегии игроков 1 и 2, то есть заданы множества стратегий X и Y, и для любых конкретных стратегий x Є X и y Є Y определена функция потерь Lср (x, y). Таким образом, мы приходим к следующему формальному определению игры:

Игра G определяется тремя элементами X, Y, Lср, что условно можно записать в виде

G = (X, Y, Lср) (3.6)

Игры, в которых каждый игрок имеет конечное число стратегий (конечные игры), удобно задавать с помощью так называемых матриц потерь. В случае игры с нулевой суммой достаточно задавать одну матрицу. Пусть G – некая конечная игра с нулевой суммой, в которой игрок 1 имеет m возможных стратегий, игрок 2n возможных стратегий, то есть X и Y есть конечные множества.

X = {x1, x2, … xn},

Y = {y1, y2, … yn}.

Тогда матрица порядка m*n

, (3.7)

элемент которой qij = Lср (xi, yi), называется матрицей потерь. Элемент матрицы qij, очевидно, имеет смысл средних потерь игрока 2 при реализации игроками стратегии xi и yi, иначе – среднего платежа игрока 2 игроку 1, если игрок 1 предпринимает стратегию xi, а игрок 2 – стратегию yi. Отсюда другое название матрицы потерь – платежная матрица.

С использованием платежной матрицы Q конечная парная антагонистическая игра G может быть формально определена тремя элементами X, Y, Q, что условно можно записать в виде:

G = (X, Y, Q) (3.8)

где

X = {xi}, i Є 1,m – m-мерное множество возможных стратегий игрока 1;

Y = {yi}, j Є 1,n – n-мерное множество возможных стратегий игрока 2;

Q = {qij}, i Є 1,m j Є 1,n – платежная матрица размера m*n.

Билет №12

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]