- •080502 - Экономика и управление на предприятии
- •080502 -Экономика и управление на предприятии машиностроения
- •080502 -Экономика и управление на предприятии машиностроения
- •Программа дисциплины «Исследование операций в экономике»
- •1. Организационно-методический раздел
- •2. Место дисциплины в учебном плане
- •3. Объем дисциплины по видам учебной работы и формам контроля
- •4. Содержание дисциплины
- •4.2. Содержание разделов дисциплины
- •Тема 1. Введение в исследование операций
- •2. Основы линейного программирования
- •3. Теория принятия оптимальных решений
- •4. Теория игр
- •5. Сетевое планирование и управление
- •Тема 6. Модели управления запасами
- •Тема 7. Элементы теории массового обслуживания
- •5. Практические занятия
- •6. Требования к итоговой аттестации студентов, изучивших дисциплину
- •7. Учебно-методическое обеспечение дисциплины
- •7.1. Рекомендуемая литература
- •7.1.1. Основная литература
- •7.1.2. Дополнительная литература
- •8. Технические средства освоения дисциплины
- •2. Конспекты лекций
- •Тема 1. Введение в исследование операций
- •Тема 2. Основы линейного программирования
- •Тема 3. Теория принятия оптимальных решений
- •Тема 4. Теория игр
- •Тема 5. Сетевое планирование и управление
- •Тема 6. Модели управления запасами
- •Тема 7. Элементы теории массового обслуживания
- •2. Простейшие системы массового обслуживания и их характеристики
- •3. Методические указания для студентов к практическим занятиям и самостоятельной работе
- •Тема 2. Основы линейного программирования
- •Методические указания к практическому занятию
- •Варианты задач для самостоятельного решения
- •Тема 2. Основы линейного программирования
- •Методические указания к практическому занятию
- •Варианты задач лп для самостоятельного решения графическим методом
- •Тема 2. Основы линейного программирования
- •Методические указания к практическому занятию
- •Варианты задач для самостоятельного решения
- •Тема 2. Транспортная задача линейного программирования
- •Методические указания к практическому занятию
- •Варианты задач для самостоятельного решения
- •Тема 3. Теория принятия оптимальных решений
- •Методические указания к практическому занятию
- •Варианты задач для самостоятельного решения
- •Тема 4. Теория игр
- •Методические указания к практическому занятию
- •Варианты задач для самостоятельного решения
- •Тема 5. Сетевое планирование и управление
- •Методические указания к практическому занятию
- •Решение
- •Варианты задач для самостоятельного решения
- •Тема 6. Модели управления запасами
- •Методические указания к практическому занятию
- •Методические указания к самостоятельной работе
- •Варианты задач для самостоятельного решения
- •4. Задания для контрольной работы студентам заочной формы обучения
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 0
- •МАтериалы для итогоВого контроля знаний Вопросы к зачету
- •Глоссарий (словарь основных терминов)
Тема 4. Теория игр
1. Основные понятия теории игр
2. Принцип минимакса и максимина в теории игр
3. Решение матричных игр без седловых точек
4. Упрощение игр
1. Основные понятия теории игр
В экономической деятельности часто встречается проблема принятия управленческих решений в условиях неопределенности. При этом неопределенность может быть связана как с сознательными действиями конкурента, противника и т.п., так и с другими факторами, влияющими на эффективность решения. Ситуации, в которых эффективность принимаемого одной стороной решения зависит от действий другой стороны, называются конфликтными.
В отличие от рассмотренных выше задач принятия решений в условиях определенности, риска и неопределенности, в которых внешняя среда (природа) предполагалась пассивной, в конфликтных ситуациях имеются противодействующие стороны, интересы которых противоположны. Теория, занимающаяся принятием решений в условиях конфликтных ситуаций, называется теорией игр.
Игра - это математическая модель конфликтной ситуации, в которой имеется, по крайней мере, два участника (игрока), каждый из которых стремится к достижению собственных целей. Задача теории игр состоит в выборе такой линии поведения данного игрока, отклонение от которой может лишь уменьшить его выигрыш.
Допустимые действия каждого из игроков, направленные на достижение некоторой цели, называются правилами игры. В общем случае правилами игры устанавливаются последовательность ходов, объем информации, которой располагает каждая сторона, о поведении другой стороны и результат (исход) игры. Правила определяют также конец игры, когда некоторая возможная последовательность выборов уже сделана и больше ходов делать не разрешается.
Количественная оценка результатов игры называется платежом.
Игра называется парной, если в ней участвуют только две стороны (два лица), либо множественной – при наличии более двух сторон. Участники множественной игры могут образовывать коалиции (игры в этом случае называются коалиционными). Множественная игра обращается в парную, если ее участники образуют две постоянные коалиции.
Парная игра называется игрой с нулевой суммой, если сумма платежей равна нулю, то есть если проигрыш одного игрока равен выигрышу второго. Такая конфликтная ситуация будет называться антагонистической.
В последние годы, помимо теории антагонистических, неантагонистических (кооперативных), конечных, бесконечных, позиционных и дифференциальных игр, начала развиваться теория рефлексивных игр. Рефлексивные игры изучают ситуации с учетом мысленного воспроизведения возможного образа действий и поведения противника. Дифференциальные игры изучают задачи преследования управляемого объекта другим управляемым объектом с учетом динамики их поведения; поведение объектов описывается дифференциальными уравнениями.
Однозначное описание выбора игрока в каждой из возможных ситуаций, когда он должен сделать личный ход, называется стратегией игрока. Стратегия игрока называется оптимальной, если при многократном повторении игры она обеспечивает игроку максимально возможный средний выигрыш (минимально возможный средний проигрыш).
Игра называется конечной, если число стратегий игроков конечно, и бесконечной, если хотя бы у одного из игроков число стратегий является бесконечным.
Выбор одной из предусмотренных правилами игры стратегий и ее осуществление называется ходом. Ходы бывают личные и случайные. Ход называется личным, если игрок сознательно выбирает один из возможных вариантов действий и осуществляет его. Ход называется случайным, если выбор производится не игроком, а каким-либо механизмом случайного выбора.
Существуют два способа описания игр: позиционный и нормальный. Позиционный способ связан с развернутой формой игры и сводится к графу последовательных шагов (дереву игры). Нормальный способ заключается в явном представлении совокупности стратегий игроков и платежной функции. Платежная функция в игре определяет для каждой совокупности выбранных игроками стратегий выигрыш каждой из сторон.
Пусть имеется два игрока, один из которых может выбрать i-ю стратегию из m своих возможных стратегий (i = 1,т), а второй, не зная выбора первого, выбирает j-ю стратегию из n своих возможных стратегий (j = 1,п). В результате первый игрок выигрывает величину aij и его цель будет заключаться в максимизации своего выигрыша, а второй игрок проигрывает эту величину и его цель – минимизация своего проигрыша. Если чисел aij составить матрицу (табл. 4.1) , то она будет называться платежной.
Таблица 4.1
Платежная матрица парной игры с нулевой суммой
Игрок 2
Игрок1 |
1 |
2 |
… |
n |
1 |
a11 |
a12 |
… |
a1n |
2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
m |
am1 |
am2 |
… |
amn |
Строки платежной матрицы соответствуют стратегиям первого игрока, а столбцы - стратегиям второго. Эти стратегии называются чистыми. Такую игру называют матричной игрой размерности m×n. В парной игре с ненулевой суммой выигрыш каждого игрока задается своей платежной матрицей. Поэтому такие игры называют биматричными.
2. Принцип минимакса и максимина в теории игр
При определении наилучших стратегий игроков следует учитывать, что противники, участвующие в игре, одинаково разумны, и каждый из них делает все для того, чтобы добиться своей цели. Выбирая i-ю стратегию игрока 1, мы должны рассчитывать, что игрок 2 ответит на нее той из своих j-х стратегий, для которой выигрыш игрока 1 будет минимальным. Найдем минимальное число в каждой строке матрицы и, обозначив его αi, запишем рядом с платежной матрицей (табл. 4.2) в добавочный столбец.
Таблица 4.2
Платежная матрица парной игры с добавочным столбцом
и добавочной строкой
Игрок 2
Игрок 1 |
1 |
2 |
… |
n |
αi=min aij j |
1 |
a11 |
a12 |
… |
a1n |
α1 |
2 |
a21 |
a22 |
… |
a2n |
α2 |
… |
… |
… |
… |
… |
… |
m |
am1 |
am2 |
… |
amn |
αm |
βj= max aij i |
β1 |
β2 |
… |
βn |
|
Игрок 1, зная свои минимальные выигрыши при любой стратегии игрока 2, будет предпочитать такую стратегию, при которой значение αi является максимальным, то есть
(4.1)
Величина α - это гарантированный выигрыш, который может обеспечить себе игрок 1. Она называется нижней ценой игры (максимином). Стратегия, обеспечивающая получение нижней цены игры, называется максиминной стратегией. Если игрок 1 будет придерживаться своей максиминной (перестраховочной) стратегии, то ему гарантирован выигрыш не меньший величины α при любом поведении игрока 2.
Игрок 2 заинтересован уменьшить свой проигрыш или, что то же самое, выигрыш игрока 1 обратить в минимум. Поэтому для выбора своей наилучшей стратегии он должен найти максимальное значение выигрыша игрока 1 в каждом из столбцов и среди этих значений выбрать наименьшее. Максимальный элемент в каждом столбце обозначим через βj. Эти элементы будем записывать в дополнительной строке табл. 4.2.
Наименьшее значение среди βj обозначим β - это верхняя цена игры (минимакс), которая определяется по формуле
(4.2)
Использование игроком 2 своей минимаксной стратегии позволит ему при любом поведении игрока 1 проиграть не больше величины β.
Для нижней и верхней цены игры всегда справедливо следующее соотношение:
(4.3)
Игры, в которых нижняя цена равна верхней называются играми с седловой точкой.
Общее значение нижней и верхней цены игры в играх с седловой точкой называется чистой ценой игры γ, а стратегии, позволяющие достичь этого значения, - оптимальными чистыми стратегиями. Оптимальные стратегии и чистая цена являются решением игры.
Оптимальные стратегии обладают важным свойством. Они определяют в игре «положение равновесия», которое заключается в том, что каждый из игроков не заинтересован в отходе от своей оптимальной стратегии, так как это ему невыгодно. Чистую цену игры γ в игре с седловой точкой при условии одинаковой разумности партнеров игрок 1 не может увеличить, а игрок 2 — уменьшить.
Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях. Вероятность применения чистой стратегии в игре с седловой точкой равна единице.
Следует отметить, что игра может иметь более одной седловой точки.
Пример 5.1. Фирма планирует освоить производство трех товаров, которые будет реализовывать на рынке, где возможна продажа конкурентом аналогичных товаров. Фирме известны вероятности реализации своих товаров при наличии на рынке товаров-конкурентов (табл. 4.3).
Таблица 4.3
Платежная матрица игры
Конкурент
Фирма |
1 |
2 |
3 |
αi
|
1 |
6 |
5 |
8 |
5 |
2 |
7 |
3 |
2 |
2 |
3 |
3 |
4 |
7 |
3 |
βj |
7 |
5 |
8 |
|
Решение:
Найдем нижнюю цену игры:
.Определим верхнюю цену игры:
.Игра имеет седловую точку, так как α=β=5. Чистая цена игры γ=5. Оптимальными чистыми стратегиями являются:
первая стратегия для рассматриваемой фирмы (производство и реализация товара 1);
вторая стратегия для конкурента (продажа товара 2).
3. Решение матричных игр без седловых точек
Поиск решения игры, платежная матрица которой не имеет седловой точки, приводит к сложной стратегии, состоящей в случайном применении двух и более чистых стратегий с определенными частотами. Такая сложная стратегия в теории игр называется смешанной. Смешанные стратегии игроков обозначаются, соответственно, pt=(p1, р2,…, рm) и qj=(q1,q2, …, qn), где р1 0, qj 0 - вероятности применения чистых стратегий i (i=1, m) и j (j=1, n), при этом
(4.4)
Платёжная функция в данном случае определяется как математическое ожидание выигрыша первого игрока при применении игроками смешанных стратегий p и q и равна
E(р,
q)=
(4.5)
В соответствии с принципом минимакса каждый игрок должен выбирать такую смешанную стратегию, которая максимизирует его наименьший гарантированный выигрыш. Аналогично случаю использования чистых стратегий наименьший гарантированный выигрыш первого игрока называется нижней ценой игры и равен
(4.6)
Аналогично определяется верхняя цена игры
(4.7)
Теорема Фон-Неймана. В любой матричной игре существует такая пара смешанных стратегий (p*, q*), что
Е(p,q*)
E(p*,q*)
E(p*,q)
для любых
p
Pm,
q
Pn;
(4.8)
(4.9)
Число γ=Е(р*,q*) называется ценой игры в смешанных стратегиях.
По теореме Фон-Неймана любая матричная игра имеет пару оптимальных смешанных стратегий. Для решения матричной игры необходимо отыскать эти оптимальные стратегии и цену игры.
Чистая стратегия называется активной, если она используется в некоторой оптимальной смешанной стратегии с ненулевой вероятностью.
Теорема об активных стратегиях. Если один из игроков использует оптимальную стратегию, то его противник достигает цены игры γ при любой своей смешанной стратегии, в которой используются только активные чистые стратегии. Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры у, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных стратегий.
В
основной теореме теории игр утверждается,
что любая конечная игра двух лиц с
нулевой суммой имеет, по крайней мере,
одно решение, возможно, в смешанных
стратегиях. Цена игры γ - средний выигрыш,
приходящийся на одну партию, - всегда
удовлетворяет условию
,
т.е. лежит между нижней и верхней ценой
игры. Следовательно, каждый игрок при
многократном покорении игры,
придерживаясь смешанных стратегий,
получает более выгодный доя себя
результат. Оптимальное решение игры в
смешанных стратегиях, также как и
решение в чистых стратегиях, обладает
свойством, которое заключается в
том, что каждый из игроков не заинтересован
в отходе от своей оптимальной
смешанной стратегии, если его противник
применяет оптимальную смешанную
стратегию, так как это ему невыгодно.
4. Упрощение игр
Для игр с платежными матрицами большой размерности отыскание решения можно упростить, если уменьшить их размерность путем вычеркивания дублирующих и заведомо невыгодных стратегий, а также замены некоторых групп чистых стратегий смешанными.
Если в платежной матрице игры все элементы строки (столбца) равны соответствующим элементам другой строки (столбца), то соответствующие этим строкам (столбцам) стратегии называются дублирующими.
В некоторых играх одна из стратегий может быть заведомо менее целесообразной, чем другая. Например, вторая стратегия дает первому игроку больший выигрыш, чем первая стратегия при любом выборе стратегии вторым игроком. Это означает, что первая строка платежной матрицы будет являться доминируемой, а вторая - доминирующей.
Будем
говорить, что строка i1
доминирует строку i2,
если для
всех j=1,…,n
справедливы
неравенства
и существует такая стратегия j0,
что
.
Если из платежной матрицы убрать все доминируемые строки, то решение игры с полученной матрицей совпадает с решением исходной игры. Таким образом, иногда можно уменьшить размерность платежной матрицы путем удаления доминируемых строк.
Аналогично доминирование определяется и для столбцов.
Столбец
j2
доминирует столбец j1,
если для
любого i = 1,
…, m справедливы
неравенства
и существует такая стратегия i0,
что
.
Платежная матрица может быть также упрощена с помощью удаления доминирующих столбцов.
Пример 4.2. Упростить игру, представленную платежной следующей матрицей (табл. 4.4).
Таблица 4.4
Платежная матрица игры
Игрок 2
Игрок 1 |
1 |
2 |
3 |
1 |
-2 |
0 |
1 |
2 |
3 |
4 |
5 |
3 |
2 |
7 |
-2 |
Решение:
Сравнивая почленно элементы 1-й и 2-й строк, видим, что все элементы 1-й строки меньше соответствующих элементов 2-й строки. Следовательно, 1-я стратегия для игрока 1 заведомо невыгодна, и ее можно исключить.
Аналогично, сравнивая элементы 1-го и 2-го столбца, исключаем 2-й столбец, так как для игрока 2 невыгодна 2-я стратегия. В полученной матрице 2х2 исключаем доминируемую 2-ю строку и т.д.
