- •Основные понятия теории игр
- •Классификация игр
- •Описание игры в развернутой форме
- •Бескоалиционные игры
- •Приемлемые ситуации и ситуации равновесия в игре
- •Стратегическая эквивалентность игр
- •Антагонистические игры. Общие сведения
- •Чистые и смешанные стратегии
- •Верхняя и нижняя цены игры при использовании смешанных стратегий
- •Основная теорема антагонистических игр.
- •Верхние и нижние цены в s-игре
- •Теорема о минимаксе
- •Геометрическая интерпретация минимакса
- •Решение антагонистических игр. Доминирующие и полезные стратегии
- •Игры с частными случаями платежных матриц
- •Решение матричных игр
- •Линейное программирование для решения матричных игр
- •Графическое решение игр 2*n и m*2
- •Бесконечные антагонистические игры
- •Строго выпуклые игры на единичном квадрате
- •Неантагонистические игры
- •Бескоалиционные игры
Строго выпуклые игры на единичном квадрате
Функция φ(x) называется выпуклой, если для любых двух точек z1 и z2 из множества Z выполняется неравенство:
φ( λz1 + (1-λ)z2 ) λφ(z1) + (1- λ)φ(z2) ,
Если неравенство строгое, то и функция строго выпуклая (если неравенство выполняется строго, то вторая производная φ˝(z)>0 ).
Опр. Игра Г=<X,Y,a> называется игрой на единичном квадрате, если X=[0,1] и Y=[0,1], а целевая функция a(x,y) определена для каждой точки этого квадрата.
Опр. Игра Г на единичном квадрате называется непрерывной, если функция платежей a(x,y) непрерывна в каждой точке единичного квадрата по обеим переменным.
Опр. Непрерывная антагонистическая игра на единичном квадрате называется выпуклой, если функция a(x,y) строго выпукла по Y для всех x X. Иными словами, для функции платежей в строго выпуклой игре имеет место неравенство:
a(x, λy1 + (1-λ)y2) < λ a(x,y1) + (1- λ) a(x,y2), .
Исходя из свойств строгой выпуклости, .
Теорема. В строго выпуклой игре на единичном квадрате 2-ой игрок имеет единственную оптимальную стратегию, которая является чистой. Цена игры в этом случае v(a), где v(a) — функция платежей.
v(a) = = , где y* — оптимальная чистая стратегия 2-го игрока.
Х* — множество стратегий 1-го игрока, состоящее из тех х* Х*, для которых выполняется условие a(x*,y*) = v(a).
х* — тоже чистые стратегии, они называются существенными стратегиями, а остальные – несущественными.
Нахождение существенных стратегий 1-ого игрока основано на выполнении следующих свойств.
Если y*=1, то у 1-го игрока существует стратегия х1, для которой
.
Геометрическое истолкование:
При уменьшении y a(x,y) возрастает.
Если y*=0, то среди стратегий 1-го игрока существует такая стратегия х2, что , y=y*.
Если имеется значение стратегии 0<y*<1, то у 1-го игрока найдутся 2 существенные стратегии х1 и х2,для которых имеет место условие
, y=y* , y=y*
Наиболее оптимальной стратегией 1-ого игрока является вероятностная смесь стратегий х1 и х2, причем х1 — с вероятностью р, х2 — с вероятностью (1-р).
— уравнение, позволяющее определить р.
Доказывается, что решение этого уравнения единственно и принадлежит интервалу .
Пример. Пусть имеется игра Г=<X,Y,a>, x,y [0,1], функция выигрыша a(x,y) = (x-y)2.
1). Рисуем график функции платежей (выигрыша):
2). Проверим функцию платежей на выпуклость.
Функция платежей строго выпукла по у. Имеем дело со строго выпуклой игрой на единичном квадрате.
Найдем v=v(a). Для этого рассмотрим функцию:
.
Построим таблицу:
y |
0 |
0.25 |
0.5 |
0.75 |
1 |
Ψ(y) |
1 |
0.5625 |
0.25 |
0.05625 |
1 |
y*=0.5
v(a)=0.25
Отсюда видим, что в нашем случае 0<y*<1, а следовательно, у 1-го игрока есть две существенные стратегии: х1 и х2. Для их нахождения рассмотрим зависимость
v(a)=a(x,y*)=(x-y*)2=(x-0.5)2=0.25
x1=0 , x2=1 — две существенных чистых стратегии 1-го игрока.
Проверим, что эти решения действительно являются существенными стратегиями (проверка на противоположность производных).
следовательно, оптимальная стратегия 1-го игрока есть вероятностная смесь по стратегиям х=х1 и х=х2. Найдем эти вероятности.
p=0.5
Покажем, что найденное решение является точкой равновесия. Рассмотрим проигрыши 2-ого игрока при оптимальной стратегии 1-ого:
a(x*,y) = p*(x1 - y)2 + (1-p*)(x2 - y)2 = 1/2(-y)2 + 1/2(1-y)2 , y, следовательно минимум 1/4.
a(x,y*) — выигрыш 1-ого игрока при условии, что 2-ой примет свою оптимальную чистую стратегию.