Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4476

.pdf
Скачиваний:
0
Добавлен:
08.01.2021
Размер:
1.05 Mб
Скачать

11

 

 

 

 

 

Если для двух стратегий Ak и At с элементами akj и atj (j =

)

выполняются условия: akj > atj, то стратегия Ak называется доминирующей, а

стратегия At, — доминируемой.

В матричной игре доминируемые и дублирующие строки (столбцы) можно опускать, что не влияет на решение задачи (игры).

Пример 1.2. Найти решение игры, определяемой матрицей

A =

.

Решение. Сведем данную матричную игру к паре симметричных двойственных задач линейного программирования.

Прямая задача: Найти минимум функции F = x1 + х2 + x3 min, при ограничениях

xi 0 (i = ).

Двойственная задача: Найти максимум функции Z = y1 + у2 + y3 — max при ограничениях

yj

0 (j =

 

).

 

 

 

 

 

 

 

Находим оптимальные планы пары двойственных задач (табл.1.2).

 

 

 

 

 

 

 

 

 

 

Таблица 1.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

1

0

0

0

Б

СБ

А0

 

 

 

 

 

 

А1

А2

А3

А4

А5

А6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

A4

0

1

2

5

1

1

0

0

 

 

 

 

 

 

 

 

 

 

2

A5

0

1

3

4

6

0

1

0

 

 

 

 

 

 

 

 

 

 

3

A6

0

1

4

3

4

0

0

1

 

 

 

 

 

 

 

 

 

 

 

12

m+1

 

Zj - cj

 

0

 

-1

-1

-1

 

 

 

0

 

 

0

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

A4

0

 

 

 

0

 

 

 

 

 

-1

 

 

 

1

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

A5

0

 

 

 

0

 

 

 

 

 

3

 

 

 

 

0

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

A1

1

 

 

 

1

 

 

 

 

 

1

 

 

 

 

0

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m+1

 

Zj - cj

 

 

 

0

 

 

 

 

 

0

 

 

 

 

0

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

A2

1

 

 

 

0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

A5

0

 

0

 

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

A1

1

 

 

 

1

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m+1

 

Zj - cj

 

 

 

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

A2

1

 

 

 

0

1

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

A3

1

 

0

 

0

0

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

A1

1

 

 

 

1

0

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m+1

 

Zj - cj

 

 

 

0

0

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из таблицы 1.2 видно, что двойственная задача имеет оптимальный план

Y*= ( ), а прямая задача — оптимальный план X* = ( ).

Следовательно, цена игры

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а оптимальные стратегии игроков

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p* = (p1, p2, p3), где pi ν · xi (i =

 

 

 

 

) и q* = (q1, q2, q3), где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

qj ν · yj (j =

).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1 =

 

 

 

 

 

 

 

 

p2 =

 

 

 

 

 

 

 

 

p3 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

 

 

 

 

 

 

 

 

 

q1 =

 

 

 

 

 

q2 =

 

 

 

 

 

 

 

q3 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, p* = (

 

 

 

 

 

 

) и q* = (

 

 

 

 

).

 

 

 

 

 

 

1.4. Статистические игры. Критерии для принятия решений

1.4.1. Во многих задачах, приводящихся к игровым, например, в управленческих задачах для принятия решения необходима информация о состоянии объекта управления в условиях его работы. В большинстве случаев полная информация о состоянии объекта отсутствует и возникает необходимость принятия решения в зависимости от объективной действительности, которую принято называть природой. Такие игры называют играми с природой. Человек статистик в играх с природой — действует осмотрительно, второй игрок (природа) действует совершенно случайно. В некоторых задачах для состояния природы может быть задано состояние природы распределением вероятностей ее состояний, в других задачах оно неизвестно.

Условия игры также задаются матрицей A =

 

= (aij)mxn

1.4.2. Условимся множество состояний природы обозначать через П или

Пj, где Пj П (j =

 

). Множество стратегий статистика обозначим через А, его

 

 

 

 

отдельные стратегии (решения) — Ai, где Ai A (i=

).

Иногда при решении игры рассматривается матрица рисков R. Элементы матрицы rij представляют собой разность между выигрышем,

который получил бы игрок А, если бы знал состояние

природы Пj, и выигрышем, который он получит в тех же условиях, применяя стратегию Ai, то есть

rij = βj - αij, где βj = max αij.

(1.16)

1.4.3. При решении игр с природой применяется ряд критериев

1. Если известно распределение вероятностей

14

различных состояний природы Пj, то применяется критерий Байеса: критерием принятия решения является максимум математического ожидания выигрыша (минимум математического ожидания риска).

Запишем платежную матрицу (aij) и матрицу рисков rij в виде таблицы 1.3 и таблицы 1.4.

 

 

 

 

 

Таблица 1.3

 

 

 

 

 

 

Стратегии Ai

Состояния природы

Средний выигрыш ai

 

 

 

 

П1

П2

Пn

 

 

 

 

 

 

 

 

A1

a11

a12

a1n

a1

A2

a21

a22

a2n

a2

 

 

 

 

 

 

Am

am1

am2

amn

am

qi

q1

q2

qn

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1.4

 

 

 

 

 

 

Стратегии Ai

Состояния природы

Средний риск rij

 

 

 

 

П1

П2

Пn

 

 

A1

r11

r12

r1n

r1

A2

r21

r22

r2n

r2

 

 

 

 

 

 

 

 

 

 

 

 

Am

rm1

rm2

rmn

rm

qi

q1

q2

qn

 

По критерию Байеса за оптимальную принимается та стратегия Ai, при

которой максимизируется средний выигрыш, то есть обеспечивается

 

 

 

 

 

 

 

где

(1.1

)

и минимизируется средний риск, то есть обеспечивается r = min ri, где

 

 

 

 

 

(1.1

)

15

2. Если все состояния природы равновероятны, то есть q1=q2=…qn=1/n, то используется принцип недостаточного основания Лапласа. Оптимальной считается стратегия, обеспечивающая максимум среднего выигрыша.

3. Максимальный критерий Вальда совпадает с критерием выбора максимальной стратегии, позволяющей получить нижнюю цену α игры для двух лиц с нулевой суммой, то есть

(1.1

4. Критерий минимального риска Сэвиджа рекомендует выбирать стратегию, при которой величина риска принимает наименьшее значение в наихудших условиях, то есть обеспечивается

(1.20)

Критерии Вальда и Сэвиджа выражают пессимистическую оценку ситуации. 5. Критерий Гурвица рекомендует принимать решение о выборе

стратегии, при которой имеет место

 

где 0 ≤

≤ 1.

 

Значения

выбираются исходя из

опыта или по субъективным

соображениям. При

0 имеет место критерий крайнего оптимизма, при

1 –

критерий пессимизма Вальда.

 

 

Пример 1.3. Руководство фирмы рассматривает возможность строительства одной из трех автозаправочных станций (АЗС): А1, А2, А3. Эффективность работы каждой из них в основном зависит от трех основных автомагистралей, стоимости топлива и его доставки, удаленности от населенных пунктов. Предположим, что вероятности трех указанных факторов, влияющих на эффективность работы АЗС, известны и составляют соответственно 0,3; 0,5; 0,2. Экономическая эффективность строительства каждой АЗС зависит от сочетания всех факторов и задана матрицей

A =

.

Дать рекомендации руководству фирмы по выбору строительства АЗС. Решение. В качестве «статистика» выступает руководство фирмы,

обладающее тремя стратегиями: А1, А2 и А3. Второй игрок «природы» П –

16

комплекс всех факторов и условий, в которых будет функционировать АЗС. «Выигрышами» статистика будут затраты, связанные с реализацией стратегий А1, А2 и А3 и составляющие платежную матрицу (табл. 1.5).

Проведем исследование по различным критериям.

 

 

 

 

 

 

 

 

 

Таблица 1.5.

 

 

 

 

 

 

 

 

 

 

 

П1

 

П2

 

 

П3

 

аi

αi

 

 

 

 

 

 

 

 

 

 

А1

-3

 

-4

 

 

-12

 

-5,3

-12

А2

-5

 

-3

 

 

-10

 

-5

-10

А3

-5

 

-4

 

 

-8

 

-5,1

-8

qi

0,3

 

0,5

 

 

0,2

 

 

 

βj

-3

 

-3

 

 

-8

 

 

 

 

 

 

 

 

 

 

 

 

Согласно критерию по Байесу

 

 

 

 

 

 

a1 = -3 · 0,3 – 4 · 0,5 – 12 · 0,2

-0,9 – 2 – 2,4 = 5,3;

 

 

a2 = -5 · 0,3 – 3 · 0,5 – 10 · 0,2

-5;

 

 

 

 

 

a3 = -5 · 0,3 – 4 · 0,5 –

· 0,2

-5,1;

 

 

 

 

a = max (-5,3; -5; -5,1) = -5 = a2, то есть оптимальная стратегия А2.

По Вальду оптимальной чистой стратегией будет А3, т. к. для нее

достигается максимин

 

 

 

 

 

 

 

 

 

 

( 12; 10; )

.

 

 

 

Составим матрицу рисков с элементами

(табл. 1.6).

 

 

 

 

Таблица 1.6

 

 

 

 

 

 

P1

P2

P3

ri

A1

0

1

4

4

A2

2

0

2

2

A3

2

1

0

2

Оптимальными по Сэвиджу будут чистые стратегии А2 и А3, т.к. при них

17

выполняется условие

Воспользуемся критерием Гурвица.

 

Пусть

0,

, тогда

 

 

 

 

 

 

Составим табл. 1. .

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1.

 

 

 

 

 

 

 

 

 

 

Р1

Р2

Р3

 

 

 

 

ti

 

 

 

 

 

 

 

 

 

А1

-3

-4

-12

-12

-8,4

-3

-0,9

-9,3

 

 

 

 

 

 

 

 

 

А2

-5

-3

-10

-10

-7

-3

-0,9

-7,9

 

 

 

 

 

 

 

 

 

А3

-5

-4

-8

-8

-5,6

-4

-1,2

-6,8

 

 

 

 

 

 

 

 

 

,3; - , ; -6, -6, , что соответствует чистой стратегии А3. Проведенное исследование показало, что чаще других оптимальной

называлась чистая стратегия А3, следовательно, ее и следует рекомендовать руководству фирмы.

18

Глава 2. ЭЛЕМЕНТЫ ТЕОРИИ МАССОВОГО ОБСЛУЖИВАНИЯ

2.1.Основные понятия

2.1.1.Теория массового обслуживания – область в прикладной математике, занимающаяся анализом процессов в системах производства, обслуживания, управления, в которых однородные события повторяются многократно. Примером систем массового обслуживания (СМО) являются ремонтные мастерские, парикмахерские, билетные кассы, телефонные системы, автозаправочные станции, магазины и т. д.

Каждая СМО состоит из определенного числа обслуживающих единиц (станций, приборов, касс, устройств), которые называют каналами обслуживания. Каналами могут быть линии связи, точки обслуживания, продавцы и т. д. По числу каналов СМО подразделяют на одноканальные и многоканальные. Заявки поступают с СМО, как правило, нерегулярно, случайно, образуя случайный поток заявок. В связи с этим СМО оказывается загружена неравномерно: 1) скапливается очень большое число заявок (они становятся в очередь или покидают СМО необслуженными) 2) СМО работает с недогрузкой или простаивает.

Задачи теории массового обслуживания носят оптимизационный характер. Экономически выгодным является тот вариант системы, при котором обеспечивается минимум суммарных затрат от ожидания обслуживания, потерь времени и ресурсов на обслуживание и от простоя каналов обслуживания.

2.1.2.Системы массового обслуживания делятся на два основных класса: СМО с отказами и СМО с ожиданием (очередью). В СМО с отказами заявка, поступившая в систему, когда все каналы заняты, покидает ее необслуженной. В СМО с ожиданием заявка встает в очередь на обслуживание, если все каналы заняты, при этом СМО с ожиданием подразделяются на разные виды, в зависимости от того, как организована очередь: с ограниченной или неограниченной длиной очереди, с ограниченным временем ожидания и т. д. В СМО с ожиданием и ограниченной длиной очереди заявка, попавшая в очередь, обслуживается обязательно.

Основными элементами СМО являются источники заявок, их входящий поток канала обслуживания и выходящий поток.

ij (ij

19

2.1.3. Процесс называется процессом с дискретными состояниями, если его возможные состояния S1, S2, S3, … можно заранее перечислить, а переход системы из состояния в состояние происходит мгновенно (скачком). Процесс работы СМО представляет собой случайный процесс с дискретными состояниями и непрерывным временем.

Случайный процесс называется марковским или случайным процессом без последствий, если для любого момента времени т0 вероятностные характерстики процесса в будущем зависят только от того, когда и как система перешла в это состояние.

Многие процессы можно приближенно считать марковскими. Для анализа случайных процессов с дискретными состояниями используют геометрическую схему – граф состояний. Состояние системы изображают кружками (прямоугольниками), а возможные переходы из состояния в состояние стрелками (ориентированными дугами), соединяющими состояния.

Модель последовательности перехода состояний в виде графа представлена на рисунке 1.1.

 

λ01

λ12

λ23

λk-1, k

λk, k+1

 

λn-1, n

 

 

 

 

 

 

 

 

 

 

 

 

 

S0

S1

 

S2

 

Sk

 

Sn

 

 

 

 

 

 

 

λ10

λ21

λ32

λk, k-1

λk+1, k

 

λn, n-1

S0, S1, S2, …, Sn – упорядоченное множество состояний системы; 0, 1, 2, …, n) - интенсивности потоков событий

Рисунок 2.1 – Модель последовательности перехода состояний

2.1.4. Под потоком событий понимается последовательность однородных событий, следующих одно за другим в какие-то случайные моменты времени.

Частота появления событий или среднее число событий, поступающих в СМО в единицу времени, называется интенсивностью потока λ. Интенсивность обслуживания заявок одним каналом при непрерывной его работе обозначается µ.

Поток событий называется стационарным, если его вероятностные характеристики не зависят от времени, λ (t) .

20

Поток событий называется потоком без последствий, если появление в потоке очередного события не зависит от того, когда появились в нем предшествующие события.

Поток событий называется ординарным, если вероятность появления более одного события за бесконечно малый промежуток времени ∆t является бесконечно малой величиной более высокого порядка (то есть события в потоке появляются поодиночке).

Поток событий называется простейшим (или стационарным пуассоновским), если он одновременно стационарен, ординарен не имеет последствий.

2.1.5. Для простейшего потока случайных событий (заявок) перечислим наиболее общие показатели для СМО.

Время между двумя соседними событиями (заявками) распределено экспоненциально с плотностью вероятности:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.1)

где – параметр распределения (интенсивность потока).

Среднее

значение

интервала времени τ между соседними заявками

(событиями) (α

σ

τ — математическое ожидание случайной величины ):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

ел

 

;

р б

;

е о

;

а том

;

г

 

т

 

 

 

мин

 

 

 

 

год

 

 

 

 

 

 

 

 

 

 

ден

Вероятность того, что число заявок, поступающих на обслуживание за промежуток времени продолжительностью t1, равно k, определяется по закону Пуассона:

 

 

 

(2.3)

 

 

 

Считается, что случайное время ожидания в очереди начала обслуживания

распределено экспоненциально:

 

f(t0t) = ν · e – ν t,

(2.4)

где ν - интенсивность движения очереди, то есть среднее число заявок, поступающих на обслуживание в единицу времени:

(2.5)

где - среднее значение времени ожидания в очереди.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]