Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
EMM.doc
Скачиваний:
5
Добавлен:
16.12.2018
Размер:
1.83 Mб
Скачать

46.Аналитический метод решения игр

 Пусть дана платежная матрица игры, приведенной к нормаль­ной форме

Пусть рi – частота применения i-той чистой стратегии игроком A.  qi – частота применения j-той чистой стратегии игроком B.

Мат. ожидание выигрыша для игрока A при условии, чтоB выбрал свою стратегиюΨ1, определяется как:  15

Математическое ожидание выигрыша для A равно: (16)

. Математическое ожидание проигрыша дляB равно:

 

    .

Найдем значения pi и qj , максимизирующие математическое ожидание выигрыша A и, соответственно, проигрыша B. Для нахож­дения условного экстремума запишем функцию Лагранжа, имеющую следующий вид: (18)

,        

где ʋ – цена игры.

Найдем частные производные функции Лагранжа по всем аргументам:

,

,

………………………… 

,

(19)

,

……………………

,

,

.

Получили систему (m+n+2)-x уравнений со столькими же неизвестными. Решая ее, находим значения pi и qj , т.е. оптимальные смешанные стратегии

; .

 Подставляя найденные значения pi и qj в выражение (17), находим цену игры. Аналогично можно составить функцию Лагранжа и систему (m+n+2)-x уравнений для игрока B. Систе­мы уравнений должны совпасть, что следует из совпадения выра­жений для математических ожиданий выигрыша игрока A и проигры­ша игрока B.

Решение системы уравнений во многих случаях целесообразно проводить по формулам Крамера, которые для системы уравнений типа (20)

имеют вид:

где ,  – соответствующие миноры определителя D. Для использования формул Крамера систему вида (19) необходимо предварительно привести к виду (20). Если система (19) не имеет решения в области значений pi и qj , лежащих в пределах [0;1], значит некоторые из чистых стратегий являются неактивными и, следовательно, частные производные функции Лагранжа по вероятности их использования не равны цене игры, т.е. в соответств.уравнении из систе­мы (19) необходимо вместо =ʋ поставить знак неравенства: < ʋ – для любого из первых 1+m  уравнений; или >ʋ – для любого из уравнений (m+1)+(m+n).

Согласно свойствам смешанных оптимальных стратегий, если частная производная функции Лагранжа по pi (qj )  меньше (больше) цены игры, то соот­ветствующая вероятность pi (qj )    равна 0 (т.е. стратегия  неактивная). Учитывая, что соответствующее значение pi (qj )  равно нулю и, понижая таким образом порядок системы (19), приходим к системе совместных уравнений, имеющих решение в интервале [0;1]. Для игр размерности 2×n или m×2 целесообразно проводить проверку стратегий на активность графическим методом.

41. ОПТИМУМ, ОПТИМАЛЬНОСТЬ – с точки зрения математики, оптимум функции есть такое ее экстремальное значение, которое либо больше других значений той же функции (тогда это глобальный или, лучше, абсолютный максимум), либо меньше других значений – тогда это глобальный (абсолютный) минимум.

Термин “оптимум” употребляется в трех значениях: 1) наилучший вариант из возможных состояний системы – его ищут, “решая задачи на О.”; 2) наилучшее направление изменений (поведения) системы (“выйти на О.”); 3) цель развития, когда говорят о “достижении О.”.

Термин “оптимальность” означает характеристику качества принимаемых решений (оптимальное решение задачи, оптимальный план, оптимальное управление), характеристику состояния системы или ее поведения (оптимальная траектория, оптимальное распределение ресурсов, оптимальное функционирование системы) и т. п.

Это не абсолютные понятия: нельзя говорить об оптимальности вообще, вне условий и без точно определенных критериев оптимальности. Решение, наилучшее в одних условиях и с точки зрения одного критерия, может оказаться далеко не лучшим в других условиях и по другому критерию. Приходится учитывать также фактор устойчивости решения.

В общей задаче математического программирования вектор переменных является точкой глобального О. (решением задачи), если он принадлежит допустимому множеству и целевая функция принимает на этом множестве значение, не меньшее (при задаче на максимум) или не большее (при задаче на минимум), чем в любой другой допустимой точке. Соответственно, точкой локального О. является вектор инструментальных переменных, принадлежащий допустимому множеству, на котором значение функции больше (меньше) или равно значениям функции в некоторой малой окрестности этого вектора. Очевидно, что глобальный О. является и локальным: обратное же утверждение было бы неверным.

Для решения задач используются экономико-математические методы, кот. классифицируются по различным признакам: По классификационному признаку “оптимальности”: оптимизационные — позволяют искать решение по заданному критерию оптимальности; неоптимизационные — поиск ведется без критерия оптимальности. По признаку “получения точного решения”: точные; приближенные. Метод относят к точным , если алгоритм метода позволяет получить только единственное решение. Метод относят к приближенным, если в поиске решения используется стохастическая информация и решение можно получить с любой степенью точности, а также если применение метода не гарантирует получения единственного решения по заданному критерию оптимальности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]