Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практические занятия_САиПР_2012-2013_к зачету.docx
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
236.8 Кб
Скачать

Практическое занятие 5 Тема 1. Решение матричных игр Теоретические сведения

Важными и хорошо изученными играми являются парные антагонистические игры.

Тройка G=<X,Y,A>, где X, Y - множества чистых стратегий 1-го и 2-го игроков соответственно, A(x,y) x X, y Yфункция выигрыша первого игрока, или просто функция выигрыша, называется антагонистической игрой с нулевой суммой.

Если X и Y конечны, то G называется конечной антагонистической игрой. Пары стратегий вида (x,y) называются ситуациями в игре G. Цель каждого из игроков в игре – получить максимальный выигрыш. Игрок 1, изменяя x X, старается максимизировать A(x,y), а игрок 2 выбирает y Y так, чтобы минимизировать A(x,y), но каждый из игроков в отдельности не контролирует полностью значение A(x,y). Задача теории игр состоит в определении наиболее рационального поведения каждого игрока.

Процесс разыгрывания конечной антагонистической игры состоит в следующем.

  1. 1-й игрок выбирает чистую стратегию x X;

  2. Независимо от первого игрока 2-й игрок выбирает чистую стратегию y Y;

  3. Возникает ситуация (x,y), в которой 1-й игрок получает от 2-го игрока выигрыш A(x,y), при этом 2-й игрок столько же проигрывает, т.е. его выигрыш составляет - A(x,y).

Так как число возможных действий каждого из игроков конечно, а содержательная сущность стратегии определяется вне математической модели, можно предполагать, что 1-й игрок имеет m стратегий, т.е. X={1,2,…,m, }, а 2-й игрок имеет n стратегий, т.е. Y={1,2,…,n}. Пусть из своих m стратегий 1-й игрок выберет i-ю стратегию (i=1,…m), а 2-й игрок выберет j-ю стратегию (j=1,…n), тогда значения функции A(x,y) естественно представить в виде матрицы A размерности m×n

где в i-й строке расположены выигрыши 1-го игрока в ситуациях (i,1),…,(i,n), а в j-м столбце – проигрыши 2-го игрока в ситуациях (1,j),…,(m,j).

Принцип минимакса (осторожности).

Предположим, что противник всеведущ и угадывает все ходы! Первый игрок предполагает, что второй все знает и для хода i первого игрока выберет j(i): aij(i)  aij, j = 1,…, n. Обозначим αi=aij(i)=min aij, j=1,…,n; i=1,...,m

Тогда лучшей стратегией для первого игрока является выбор i0 такой, что

α=maxiai=maxi minjaij=αi0

Величину  назовем нижней ценой игры в чистых стратегиях.

Второй игрок из соображений осторожности считает, что первый  j выберет i(j) так, что aij (j)  aij,  i, т.е. βj=max aij,j=1,…,m и выбирает j с минимальным j, т.е.

Β=minj maxi aij=βj0

Величину  назовем верхней ценой игры в чистых стратегиях.

Постановка задачи

При отсутствии седловой точки среди чистых стратегий приходится искать таковую среди смешанных. Применение минимаксных стратегий обеспечивает первому игроку выигрыш не меньше α, а второму – проигрыш не больше β. Поскольку α < β , для игрока 1 естественно желание увеличить выигрыш, а для игрока 2 – уменьшить проигрыш. Поиск такого решения приводит к использованию сложной стратегии, состоящей в случайном применении двух или более чистых стратегий с определенными частотами. Такая сложная стратегия в теории игр называется смешанной. Каждый из игроков применяет свои стратегии независимо от другого игрока.

Смешанной стратегией игрока А называется применение чистых стратегий A1 , A2 , …,Am c вероятностями p1 , p2 , …,pm.

Смешанную стратегию первого игрока обозначают как вектор:

P = ( p1 , p2 ,…,pm ) , где p1 + p2 +…+ pm = 1 и p1 , p2 , …,pm ≥0

Смешанной стратегией игрока B называется применение чистых стратегий B1 , B2 , …,Bn c вероятностями q1 , q2 , …,qn.

Смешанную стратегию первого игрока обозначают как вектор:

Q = ( q1 , q2 ,…,qn ) , где q1 + q2 +…+ qn = 1 и q1 , q2 , …,qn ≥0

Если игрок 1 прибегает к своему выбору i с вероятностью pi , а игрок 2 - к своему j-му выбору с вероятностью qj , то, поскольку стратегии выбираются игроками независимо, вероятность выбора пары стратегий равна произведению xi, yj, и математическое ожидание выигрыша игрока 1 в смешанных стратегиях {P,Q} равно .

Игра имеет решение в смешанных стратегиях, если есть такие оптимальные стратегии x*, y* и число G такое, что при любых смешанных стратегиях x и y выполняется соотношение

G(x,y*)≤GG(x*,y)

Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры V, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных стратегий. Теорема фон Неймана утверждает, что любая матричная игра с нулевой суммой всегда имеет седловую точку, т.е. существуют векторы P и Q такие, что

(V - цена игры).

Поиск цены игры и соответствующих вероятностей сводится к решению пары двойственных задач линейного программирования [1-3].

Задание 1. Решить матричную игру, заданную платежной матрицей

Пусть у игроков A и B разные интересы. Игра задана платежной матрицей Aij размером (mxn). Требуется найти решение матричной игры.

Матрица 1

6

7

9

3

8

9

2

3

4

6

10

5

Матрица 2

6

7

9

7

3

8

9

3

2

3

4

2

6

10

5

5

Матрица 3

5

5

6

7

9

1

3

2

3

8

2

3

5

8

5

4

Матрица 4

4

3

8

2

9

1

4

10

6

8

1

4

6

3

9

5

Матрица 5

1

3

4

8

4

1

9

7

6

7

9

3

2

4

3

7

Матрица 6

2

2

3

4

1

2

10

10

9

6

5

4

9

8

9

6

Матрица 7

4

3

8

2

9

1

4

10

6

8

1

4

6

3

9

5

Матрица 8

1

3

4

8

5

4

1

9

7

5

6

7

9

1

8

2

4

3

7

2

Матрица 9

9

10

9

2

5

8

1

1

7

5

8

7

2

6

8

7

7

3

2

2

Матрица 10

10

1

3

5

7

5

8

1

5

4

1

1

7

5

5

8

5

7

9

10

Матрица 11

9

9

3

10

6

2

2

10

7

2

7

4