Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Управление и оптимизация / Novikov - Teoriya upravleniya organizatsionnimi sistemami 2005

.pdf
Скачиваний:
162
Добавлен:
02.09.2019
Размер:
3.38 Mб
Скачать

Приведем решения обратных задач информационного управления для следующих вариантов.

Вариант I. Пусть центр осуществляет унифицированное (однородное) информационное регулирование, то есть структура информированности i-го агента есть Ii = θ, i N, θ Ω, и сообщаемое центром значение состояния природы θ является общим знанием. Фрагмент (для i-го и j- го агентов) графа соответствующей рефлексивной игры имеет вид θ ↔ θ и не зависит от рассматриваемых агентов.

Множество всевозможных информационных равновесий игры агентов в этом случае есть отрезок (1/4; 1/4) – (1/2; 1/2). Множество информационных равновесий при фиксированном θ [1; 2] есть точка с координатами (θ / 4; θ /4). Поэтому согласованной является единственная норма i1(θ ) = θ / 4, i = 1, 2.

Решение обратной задачи следующее: реализуемыми как информационные равновесия являются одинаковые действия обоих агентов из отрезка [1/4; 1/2]. Для того чтобы агенты выбрали вектор действий x1 = , α), следует выбрать θ = 4 α, α [1/4; 1/2].

Вариант II. Пусть центр осуществляет персонифицированное информационное регулирование, то есть структура информированности i-го агента есть Ii = θi, θi Ω, i N, и индивидуальные представления агентов о состоянии природы являются общим знанием. Фрагмент (для i-го и j-го агентов) графа соответствующей рефлексивной игры имеет вид θi ↔ θj. Тогда множество всевозможных информационных равновесий игры агентов есть EN, то есть шире, чем в первом варианте.

Множество всевозможных информационных равновесий EN игры агентов в этом случае – параллелограмм AGCF (рис. 9.3). Множество информационных равновесий при фиксированном векторе (θ1, θ2) [1; 2]2

450

есть точка с координатами, определяемыми выражением (4).

Поэтому согласованной является единственная норма

i21, θ2) = (3 θi θ3–i) / 8, i = 1, 2.

Решение обратной задачи следующее: реализуемыми как информационные равновесия являются действия агентов из параллелограмма AGCF. Для того чтобы агенты

выбрали

вектор

действий

x2 = ( x2

,

x2 ), следует выбрать

θ1

 

 

, θ2

 

 

1

 

2

= 3 x2

+ x2

= x2

+3 x2 .

 

 

 

1

2

 

 

1

 

2

 

 

Вариант III. Пусть центр осуществляет рефлексивное управление, сообщая каждому агенту информацию о неопределенном параметре, а также то, что о значениях этого параметра думают («знают») остальные агенты, то есть структура информированности i-го агента есть

Ii = i, θij}, θi, θij Ω, i, j N. Фрагмент (для i-го агента) графа соответствующей рефлексивной игры имеет вид:

θi ↔ θij.

Множество всевозможных информационных равновесий E игры агентов в этом случае – квадрат ABCD (рис. 9.3).

Рассмотрим для примера первого агента. С его субъективной точки зрения множество информационных равновесий при фиксированном векторе (θ1, θ12) [1; 2]2 есть точка с координатами, определяемыми выражением (4), то есть

y1* 1, θ12) = (3 θ1 θ12)/ 8, y12* 1, θ12) = (3 θ12 θ1)/ 8. (7)

Из (7) получаем, что для того, чтобы первый агент выбрал действие x13 X10 = [1/8; 5/8], вектор (θ1, θ12) должен удовлетворять:

 

(3 θ1 – θ12)/ 8 = x3 ,

 

 

(8)

 

 

1

 

 

 

 

(3 θ12 – θ1)/ 8 BR212,

x3 ) = (θ12

x3 ) / 3.

 

(9)

 

 

1

1

 

 

Условие (9) выполнено всегда в силу определения

информационного равновесия, поэтому

 

 

 

Ω 3

( x3 ) = {(θ1, θ12) [1; 2]2

| (3 θ1 – θ12) /8 = x3

}.

(10)

1

1

 

1

 

 

451

Аналогично, для второго агента:

Ω23 ( x23 ) = {(θ2, θ21) Î [1; 2]2 | (3 θ2 – θ21)/ 8 = x23 }. (11)

Согласованной является норма

Ài3i, θij) = (3 θi – θij) /8, i ¹ j, i, j = 1, 2.

Вариант IV. Альтернативой варианту III является следующий варинт: центр формирует у i-го агента (напри-

мер, путем публичного

сообщения

значения

параметра

θ Î Ω, а затем частного

сообщения

значения

параметра

θi Î Ω ) структуру информированности Ii = i, {θij = θ }j ¹ i). Обозначим θi4 = i, θ ) Î Ω 2, i Î N.

Фрагмент (для i-го агента) графа соответствующей рефлексивной игры (см. главу 8 и Приложение 1) имеет вид θi ¬ θ « θ. Множество равновесий Нэша игры фантомных агентов второго и третьего уровня структуры информированности есть EN (θ, θ, …, θ ) (см. выражение (3)), причем это множество могут вычислить все агенты. Следовательно, Xi4 i, θ ) = BRi i, (EN (θ, θ, …, θ ))i). Обозначим множество возможных информационных равновесий в рассматриваемом варианте

E4 = U {y Î A' | yi Î U Xi4 i, θ )}.

(12)

θ Ω

θi Ω

 

В рассматриваемом примере множество E4 представляет собой шестиугольник KLMNPH (рис. 9.3).

Фиксируем вектор x4 Î X' действий агентов. Обозначим Ω 4(x4) – такое множество значений векторов параметров ({θi}i N, θ ) Î Ω n + 1, при котором данный вектор действий является информационным равновесием (решение обратной задачи информационного управления):

Ω 4(x4) = {({θi}i N, θ ) Î Ω n + 1 | " i Î N

 

x4

Î BRi i, (EN (θ, θ, …, θ ))i)}.

(13)

i

 

 

452

Так как информированностью i-го агента является вектор qi4 Î W 2, то получаем, что в рассматриваемом ва-

рианте IV норма Ài4 (×) является согласованной, если

" q 4

Î W 2, À4

(q 4 ) Î X 4

(q 4 ).

(14)

i

i

i

i

i

 

Результаты исследования обратных задач информационного управления для четырех рассмотренных вариантов позволяют сделать вывод, что с точки зрения множеств информационных равновесий эти варианты соотносятся следующим образом [42]:

I Í II Í III, IV Í III, II Í IV; II Ç IV ¹ Æ,

а с точки зрения множеств согласованных норм: I Í IV Í III = II.

453

ЗАКЛЮЧЕНИЕ

Полученные в теории управления организационными системами теоретические результаты нашли свое применение при создании прикладных моделей, которые, в свою очередь, использовались на практике при синтезе или модификации механизмов управления реальными социаль- но-экономическими системами. Следует отметить, что многие классы одних и тех же прикладных механизмов с соответствующими модификациями использовались при решении самых разных прикладных задач.

Ниже перечисляются области внедрения и основные работы, содержащие описание методик внедрения и опыта практического использования прикладных моделей.

С точки зрения масштаба наиболее крупным объектом управления являются регионы. При разработке и реа-

лизации программ регионального развития используются методы комплексного оценивания состояния региона, конкурсные механизмы отбора предприятий в программу регионального развития, методы оптимизации программ по стоимости, механизмы распределения финансовых ресурсов, в том числе механизмы согласия и экспертные меха-

низмы [1, 13].

Наиболее богатый опыт внедрения результатов моделирования механизмов управления накоплен, наверное, в

области управления промышленными предприятиями [3, 11, 22, 65, 67]. Совершенствование хозяйственного механизма, реформирование и реструктуризация предприятий и корпоративных структур требуют использования механизмов

454

распределения корпоративных заказов и финансов, в том числе методов «затраты – эффект», механизмов определения внутренних цен, стимулирования и оперативного управления.

Обширной областью применения теоретических результатов решения задач управления ОС стали механизмы управления проектами (УП), охватывающие большинство задач УП и используемые на протяжении всего жизненного цикла проекта [3, 11, 14, 18, 22, 29, 30, 35, 64].

Другой областью являются организационные и эко-

номические механизмы управления безопасностью слож-

ных систем [3], в том числе создаваемые в рамках Федеральной программы «Безопасность».

Богатый опыт был накоплен по реализации механизмов управления развитием приоритетных направлений науки и техники [14, 33], в том числе – разрабатываемых совместно с Миннауки РФ.

Интересную, как с содержательной, так и с методической точки зрения, область представляют механизмы управления образовательными системами [41, 44], в том числе качеством подготовки специалистов [15], которые использовались, совместно с имитационными играми [67], в качестве содержания и форм учебного процесса.

Механизмы обмена [31] применяются при оптимизации взаимозачетных схем на межгосударственном уровне, а также при оптимизации давальческих схем [6].

Наконец, отметим широкое применение многока-

нальных механизмов в автоматизированных системах управления производством [9].

Полученные результаты свидетельствуют, что использование моделей теории управления является средством повышения эффективности управления социальноэкономическими и организационными системами самого разного масштаба – от бригады и цеха до отрасли и регио-

455

на. В то же время, практика все время ставит перед специалистами по управлению все новые и новые задачи.

Сточки зрения актуальности дальнейшего развития теории можно выделить следующие классы задач: адекватного учета и дальнейшего развития в формальных моделях современных представлений психологии, экономики и социологии; разработки моделей и методов синтеза состава

иструктуры ОС, в том числе многоуровневых, динамических и сетевых структур управления; разработки моделей и методов информационного управления; разработки методов оценки эффективности и синтеза комплексных механизмов на основе системы базовых механизмов, рассмотренных в настоящей книге.

Спрактической точки зрения следует выделить необходимость обобщения опыта практического использования различных механизмов управления с целью создания прикладных методик и автоматизированных информационных систем, которые позволили бы использовать в каждом конкретном случае адекватные и эффективные процедуры управления. Кроме того, важными организационными задачами представляются, во-первых, подготовка специалистов по управлению, оснащенных полным арсеналом современных знаний и навыков в области управления, и, во-вторых, популяризация теоретических результатов и установление более тесных содержательных и информационных связей с близкими разделами науки и практики управления, ведь дальнейшее успешное решение теоретических и практических задач управления организационными системами возможно только совместными усилиями математиков, психологов, экономистов, социологов и представителей других отраслей науки.

456

ПРИЛОЖЕНИЕ 1

ЭЛЕМЕНТЫ ТЕОРИИ ИГР

Настоящее приложение содержит описание основных понятий и моделей теории игр. В том числе кратко рассматриваются: некооперативные игры, кооперативные игры, иерархические игры и рефлексивные игры. Для более полного ознакомления с проблематикой и результатами использования теоретико-игровых моделей в задачах управления организационными системами можно рекомендовать учебники и монографии [20, 23, 25, 34, 38, 39, 60, 68, 69].

П.1.1. Некооперативные игры

В первой главе описаны модели индивидуального принятия решений. Рассмотрим теперь игровую неопределенность, отражающую совместное принятие решений несколькими агентами (при заданных управлениях со стороны центра), в рамках которой существенными являются предположения агента о множестве возможных значений обстановки игры (действий других агентов, выбираемых ими в рамках тех или иных неточно известных рассматриваемому агенту принципов их поведения).

Для описания коллективного поведения агентов недостаточно определить их предпочтения и правила индивидуального рационального выбора по отдельности. Как отмечалось выше, в случае, когда в системе имеется единственный агент, гипотеза его рационального (индивидуального) поведения предполагает, что агент ведет себя таким образом, чтобы выбором действия максимизировать значение своей целевой функции. Если агентов несколько, необходимо учитывать их взаимное влияние: в этом случае

457

возникает игра – взаимодействие, в котором выигрыш каждого агента зависит как от его собственного действия, так и от действий других агентов. Если в силу гипотезы рационального поведения каждый из агентов стремится выбором действия максимизировать свою целевую функцию, то понятно, что в случае нескольких агентов индивидуально рациональное действие каждого из них зависит от действий других агентов.

Рассмотрим теоретико-игровую модель некооперативного взаимодействия между n агентами, предполагая, что они принимают решения одновременно и независимо, не имея возможности договариваться о выбираемых действиях, перераспределять получаемую полезность (выигрыш) и т. д.

Каждый агент осуществляет выбор действия xi,

принадлежащего допустимому множеству Xi, i Î N = {1, 2, , n} – множеству агентов. Выбор действий агентами осуществляется однократно, одновременно и независимо.

Выигрыш i-го агента зависит от его собственного действия xi Î Xi, от вектора действий

x-i = (x1, x2, , xi–1, xi+1, , xn) Î Xi = X j

j N \{i}

оппонентов N\{i} и от состояния природы73 θ Î Ω и описывается действительнозначной функцией выигрыша

fi = fi (θ, x), где x = (xi, xi) = (x1, x2, …, xn) Î X' = X j

j N

вектор действий всех агентов, который называется ситуацией игры. При фиксированном значении состояния природы совокупность Г0 = (N, {Xi}i N, {fi (×)}i N) множества агентов, множеств их допустимых действий и целевых

73 Состояние природы может быть, в том числе, вектором, компоненты которого отражают индивидуальные характеристики (типы) агентов.

458

X j .

функций называется игрой в нормальной форме. Решением игры (равновесием) называется множество устойчивых в том или ином (и оговариваемом в каждом конкретном случае) смысле векторов действий агентов [25].

В силу гипотезы рационального поведения каждый агент будет стремиться выбрать наилучшие для него (с точки зрения значения его целевой функции) действия при заданной обстановке. Обстановкой для него будет совокупность состояния природы θ Ω и обстановки игры

xi = (x1, x2, , xi1, xi+1, …, xn) Xi =

j N \{i}

Следовательно, принцип принятия i-м агентом решения о выбираемом действии (при фиксированных обстановке и состоянии природы) можно записать следующим обра-

зом (BR обозначает наилучший ответ best response)74:

BRi(θ, xi) = Arg max fi (θ, xi, xi), i N.

xi X i

Рассмотрим возможные принципы принятия решений агентами, каждый из которых порождает соответствующую концепцию равновесия, то есть определяет, в каком смысле устойчивым должен быть прогнозируемый исход игры.

Равновесие в доминантных стратегиях. Если для некоторого агента множество его наилучших ответов не зависит от обстановки, то оно составляет множество его доминантных стратегий (совокупность доминантных стратегий всех агентов называется равновесием в доминантных стратегиях – РДС) [25]. Если у каждого из агентов существует доминантная стратегия, то они могут принимать решения независимо, то есть выбирать действия, не имея никакой информации и не делая никаких предположений

74 При использовании максимумов и минимумов предполагается, что они достигаются.

459