Диплом Костин С.С
.pdfКритерий 4.1 Стратегия vi лучше стратегии vj , если выполняется отношение:
t |
|
Fi |
|
Fj |
dt = +∞ |
|
n→∞ t0 |
|
− |
|
(2.6) |
||
xi |
xj |
|||||
lim |
|
|
|
|
|
|
Следствие 4.1 Стратегия vi является наилучшей среди допустимых стратегий vj
(vi vj для всех j = 1, n, j ̸= i), если выполняются условия:
|
T |
|
Fi |
|
Fj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
lim |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
t0 |
xi |
− xj dt = +∞, j = 1, n, j ̸= i. |
(2.7) |
||||||||||||||||||
T →∞ |
|||||||||||||||||||||
Определение 5. Пусть ξ(t) – непрерывная функция. Если существует предел |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
lim |
1 |
|
t0 |
ξ |
τ |
dτ |
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
t→∞ t |
( |
|
) |
|
|
|
|
|
|
||||||||
, тогда |
|
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
lim |
1 |
|
t0 |
ξ |
|
τ |
dτ |
(2.8) |
||||||||
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
ξ = t→∞ t |
( |
) |
|
|
|
называется временным средним функции ξ(t).
Замечание 5.1 Если непрерывная функция ξ(t) имеет предел при t → ∞, то его
временное среднее значение совпадает со значением этого предела.
|
|
ξ |
|
lim |
t |
ξ (τ) dτ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
t0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Легко видеть, что |
|
= t→∞ |
|
|
t |
|
|
, как это следует из правила Лопиталя. |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Fi |
Fj |
||||||||
Следствие 5.1 Пусть существуют временные средние |
|
и |
|
|
, различные |
|||||||||||||||||||||||
xi |
xj |
|||||||||||||||||||||||||||
для разных стратегий. Тогда vi |
vj |
, если выполняется неравенство: |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
F |
Fj |
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
i |
|
> |
|
|
|
(2.9) |
|||||||||||||
|
|
|
|
|
|
|
|
xi |
xj |
|||||||||||||||||||
Следствие.5.2 Стратегия vi |
является наилучшей среди допустимых стратегий vj |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Fi |
|
|
Fj |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
(vi vj для всех j = 1, n, j ̸= i), если выполняются неравенства |
|
|
> |
|
для всех |
|||||||||||||||||||||||
xi |
xj |
|||||||||||||||||||||||||||
i ̸= j. |
|
|
|
|
|
|
|
|
|
|
|
F |
|
|
|
|
|
|||||||||||
Таким образом, временное среднее значение |
i |
является критерием оптимальности |
||||||||||||||||||||||||||
xi |
||||||||||||||||||||||||||||
для vi. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Во многих случаях функции Fi имеют вид: |
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
||||||||||||
|
|
|
|
Fi = Фi(x, t) − xi |
Фj(x, t), i = |
|
|
|
(2.10) |
|||||||||||||||||||
|
|
|
|
1, n, |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
||||||||||||
тогда система (2.2) запишется следующим образом: |
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
||||||||||||
|
|
|
|
x˙i = Фi(x, t) − xi |
Фj(x, t), i = |
|
|
(2.11) |
||||||||||||||||||||
|
|
|
|
1, n. |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
10
Для данной системы имеет место интегральный критерий строгого отбора.
Критерий 2. Для того, чтобы система (2.11) являлась системой строго отбора,
необходимо и достаточно, чтобы вдоль любой фазовой траектории системы (2.11), со-
n
ответствующей начальным условиям xi(t0) = x0, x0 ≥ 0, xi = 1, i = 1, n , удовлетво-
i=1
ряющим неравенствам: 0 < x0i < 1, были справедливы равенства:
+∞ |
t, x t |
)) |
|
t, x t |
)) |
|
|
|
|
|
|
||
t0 |
|
Ф1( ( |
− |
Фi( ( |
dt = +∞ |
|
|
|
(2.12) |
||||
x1 |
|
xi |
|
|
|
|
|||||||
В этом случае имеет место приведенное ниже свойство. |
|
|
|
|
|||||||||
Следствие 2.1 Пусть существуют временные средние |
Фi |
|
и |
Фj |
. Тогда vi vj, |
||||||||
xi |
xj |
||||||||||||
если выполняется неравенство: |
|
|
> xj |
|
|
|
|
|
|
(2.13) |
|||
|
|
xi |
|
|
|
|
|
||||||
|
|
|
Фi |
Фj |
|
|
|
|
|
|
|
|
для всех j = 1, n, i ̸= j.
11
3. Модель И.Г. Поспелова
3.1. Дискретная модель И.Г. Поспелова
Принимая решения, исполняющий данную роль субъект старается выбрать наилучшее с его точки зрения решение, то есть действует в своих интересах. Эти интересы не обязательно считать сугубо эгоистическими: субъект может искренне стремиться, например, к благу всего человечества. Важно другое, если роль производителя будут часто занимать субъекты, стремящиеся, скажем, провести, как можно больше социологических конференций, производство вряд ли будет работать. Мотивы и роли должны быть взаимно согласованы. Заметим, что в моделях экономики такое согласование обычно принимается, как самоочевидное: производитель максимизирует прибыль (или стремится выполнить план), потребитель максимизирует полезность своего потребления и т. п. Опишем на языке мотивации субъекта с помощью абстрактной модели результат действия ”частот неудач” каждой стратегии, то есть механизмов отбора, поддерживающих согласование ролей и интересов. Рассмотрим некую роль, которую можно исполнять одним из некоторого конечного множества способов (стратегий) M. Данную роль в экономике исполняют параллельно множество S субъектов. В типичном для экономике случае мощность множества
M составляет от десятков тысяч до миллионов субъектов. Субъекты используют разные стратегии. Обозначим через sk(t) число субъектов, использующих стратегию k в момент времени t. Распределение субъектов по стратегиям:
s¯(t) = sk(t) : k M, sk(t) ≥ 0, |
sk(t) = S |
, |
(3.1) |
|
|
|
|
k M
нашей модели характеризует состояние рассматриваемой системы.
Предположим, что в течение малого промежутка времени ∆ субъект, использующий стратегию k, независимо от предыстории и действий других субъектов с вероятностью
ωk∆(t) + o(∆t) подпадает под действие упомянутых механизмом отбора поведения и оказывается вынужденным сменить свою стратегию. Набор постоянных ”частот неудач” ωk
характеризует в модели среду, в которой субъекты исполняют свою роль. Предполагается, что субъекты не осознают связь между стратегией и частотой неудачи или игнорируют ее. Например, модель допускает случай, когда субъект вовсе не хочет исполнять данную роль и не интересуется результатом своей деятельности. Будем считать, что субъект, изменяющий свою стратегию, выбирает новую i-ю с вероятностью pi(t):
pi(t) : i M, pi(t) ≥ 0, pi(t) = 1,
i M
возможно зависящей от состояния s¯(t) , но не зависящей от предыстории процесса.
12
Можно также, считать, что субъект, потерпевший неудачу, ”выбывает из игры”, и его место занимает новый, выбирающий свою стратегию с вероятностью pi(t). Таким образом, динамика системы описывается марковским процессом:
|
Sk(t), с |
вероятностью (ωk∆ + o(∆)) i M pi(t), i ̸= k, |
|
|||||
|
S (t) + 1, |
|
|
|
|
|
(3.2) |
|
Sk(t + ∆) = |
|
|
(ω ∆ + o(∆))p (t), i = k, . |
|||||
|
|
|
|
|
|
|
̸ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
с |
вероятностью |
i |
k |
|
|
|
Sk(t) − 1, с |
вероятностью |
(ωk∆ + o(∆))pi(t), i ̸= k. |
|
||||
|
|
|
|
|
|
|
|
|
Рассмотрим простейший случай, когда pi(t) = θk = const. Такое предположение соответствует случаю, когда субъекты ничему не обучаются, а исполняют роль в соответствии с априорными представлениями о ней, выработанными, например, в процессе общей социализации индивидуума. В этом случае описанный марковский процесс приходит к стационарному состоянию, в котором при большом S численности s(t) будут практически равны своим средним значениям:
|
|
pkS |
|
|
||
|
|
ωk |
(3.3) |
|||
Esk = |
|
|
|
. |
||
|
pj |
|||||
|
|
|
|
|
j M ωj
Это соотношение показывает, что при постоянных pk(t) выработки определенного поведения в системе не происходит. Численности соответствуют априорным вероятностям, ”перекошенным” в соответствии с частотами неудач. Рассмотренный случай модели, описывает процесс близкий к дарвиновскому естественному отбору, но без фактора наследственности - субъекты не размножаются, передавая свою стратегию потомкам.
Предположим, что при смене стратегии субъект руководствуется с вероятностью ε,
0 ≤ ε < 1 априорными представлениями θi, а с вероятностью 1 − ε - популярностью данной стратегии среди других субъектов:
pi(t) = εθi + (1 − ε) |
si(t) |
(3.4) |
S . |
Получающийся при этом предположении модель задает, так называемый, ”нелинейный ветвящийся процесс”. В данном случае удается доказать следующую теорему.
13
Теорема 1. Eсли S → ∞ , а ε → 0 так, что величина Nε4 отделена от 0, то независимо от начального состояния с течением времени почти все субъекты будут использовать стратегии из множества:
Q = argminωk, |
(3.5) |
k K |
|
то есть стратегии с минимальной частотой неудачи. Именно, вероятность, того, что
|
1 |
|
1 |
√ε |
|
|
|
C exp−Ωt +C |
√ε |
C |
C |
||
доля субъектов, |
|
|
nk |
(t) , использующих стратегии с минимальной частотой неуда- |
|||||||||
|
N |
k Q |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
чи, окажется меньше |
− |
|
, не превосходит величины 1 |
2 |
|
, где |
1 и 2 |
||||||
– положительные постоянные, не зависящие от S, ε, а Ω – обусловленность минимума |
|||||||||||||
|
|
|
|
|
|
minω |
|
|
|
|
|
||
частоты неудачи: Ω = minωk − k |
|
M k. |
|
|
|
|
|
||||||
|
|
|
k K\Q |
|
|
|
|
|
|
|
Выше мы рассматривали субъектов, одинаковых в том смысле, что они имеют совпадающие априорные вероятности выбора стратегий. Теорема обобщается на случай, когда у разных субъектов величины θk различны. При утверждение теоремы неверно. В рассматриваемом процессе с конечными вероятностями возникают состояния, когда ни один субъект не использует некоторую стратегию. В случае ”чистого подражания” ε = 0 эти состояния будут поглощающими. Приведенная теорема позволяет сделать вывод, что подражание распространенным образцам приводит к выделению поведения, минимизирующего вероятность неудачи. Таким образом, для внешнего наблюдателя сочетание механизмов отбора и подражания будет выглядеть, как наличие у субъектов мотивации минимизировать вероятность неудачи в исполнении роли, независимо от личного отношения субъектов к роли и стратегии. То есть эта мотивация носит объективный характер, в том смысле, в каком говорил об объективных интересах К. Маркс.
Выше было сказано о подражании, как о специфически социальном механизме, не исключено, что аналогичный процесс идет и биосфере благодаря переносу генов. Теорема показывает, что характерное время выделения оптимального поведения составляет величину порядка Ω−1. Предположим, что частоты неудач ωk время от времени перестраиваются, причем так, что в каждый момент имеется единственная стратегия с минимальной частотой неудач, а обусловленность минимума Ω не меняется. Тогда наблюдаться будет не одна стратегия, а целый спектр, содержащий τΩ стратегий, где τ характерное время смены номера оптимальной стратегии. Этот означает, что рассмотренный процесс автоматически поддерживает соответствие между разнообразием среды и разнообразием поведения. Представляется, что так можно объяснить вспышки мутаций, возникающие в биоценозах в ответ на резкие изменения окружающей среды.
14
3.2. Обобщение модели И.Г. Поспелова на непрерывный случай
Обозначим xi = si/S, i = 1, n – удельные доли числа субъектов, осуществляющих выбор стратегии. Введем обозначение x(t) = (x1, x2, ..., xn). Тогда при сделанных предположениях динамика изменения числа субъектов, выбирающих ту или иную стратегию, представляет случайный процесс. Принятые гипотезы определяют динамику выбора состояний как случайный процесс. Введем в рассмотрение квадратную матрицу переходов размерности n на n. Каждый ее элемент, стоящий в i-й строке и j-м столбце имеет смысл вероятности перехода за время ∆t от i-го варианта поведения к j-му. Диагональный эле-
мент, стоящий на i-м месте, имеет смысл сохранения за время ∆t числа субъектов si.
Матрица переходов имеет вид:
|
|
n |
|
|
|
(pn(t)ω1∆t) + o(∆t) |
|
|
|
|
1 − j=2(pj(t)ω1∆t) + o(∆t) · · · |
|
|
||||||
|
|
|
· · · |
|
|
|
. |
|
|
Π(t, ∆t) = |
(p1(t)ω2∆t) + o(∆t) |
|
(pn(t)ω2∆t) + o(∆t) |
|
|||||
|
|
.. |
.. |
. |
|
|
.. |
|
(3.6) |
|
|
. |
|
|
n |
. |
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
|
(p1(t)ωn∆t) + o(∆t) |
· · · |
1 |
|
(pj(t)ω1∆t) + o(∆t) |
|
||
|
|
|
|
− j=1 |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вектора x(t) и x(t + ∆t) связаны соотношением x(t + ∆t) = x(t)Π(t, ∆t), отсюда:
∆xi = xi(t + ∆t) − xi(t) = 1 − (xjpi(t)ωj∆t) + o(∆t)
j̸=i
Получим динамику изменения удельных долей числа субъектов, использующих стратегию vi, i M в момент времени t:
n |
|
|
|
|
j |
|
|
|
(3.7) |
x˙i = −ωixi − pi(t) |
−ωjxj, i = 1, n. |
|||
=1 |
|
|
|
|
n
Сумма правых частей будет равна нулю, когда pi(t) = 1, следовательно при этом
i=1
условии данная система является системой на стандартном симплексе.
15
4. Исследование модификаций непрерывной модели
4.1.Модификация модели с постоянными значениями вероятностей
Как было сказано в главе 3.1, при pi(t) = θi = const субъекты ничему не обучаются, а исполняют роль в соответствии с априорными представлениями о ней. В этом случае
динамика приходит к состоянию, в котором при большом S численности sk(t) будут прак- pk
|
|
|
ωk |
|
|||
тически равны своим средним значениям: xk = |
. Соотношение показывает, что при |
||||||
pj |
|||||||
|
|
|
|
|
|
|
j M ωj
постоянных pk выработки определенного поведения в системе не происходит. Численности соответствуют априорным вероятностям θk, ”перекошенным” в соответствии с частотами неудач.
Исследуем систему:
n |
|
|
|
|
j |
|
|
|
(4.1) |
x˙i = −ωixi − θi |
−ωjxj, i = 1, n, |
|||
=1 |
|
|
|
|
аналитически в случае n = 3 при ω1 = 1, ω2 = 1, ω3 = 1, θ1 = 0.2, θ2 = 0.7, θ3 = 0.1. Имеем систему:
Так как система является системой на стандартном симплексе, с помощью замены x3 = 1 − x1 − x2 можно перейти к системе 2-ух уравнений. Решив её методом Гаусса было найдено состояние равновесия (особая точка) с координатами (0.2, 0.7, 0.1). Теперь
составим Якобиан усеченной системы |
ДУ: |
|
|
−1 |
− λ 0 |
= 0. |
(4.2) |
0−1 − λ
Полученные собственные числа матрицы Якоби λ1, λ2 < 0, значит делаем вывод: состояние равновесия является устойчивым узлом. На Рис. 1 можно видеть фазовый портрет системы в случае n = 3 при ω1 = 1, ω2 = 1, ω3 = 1, θ1 = 0.2, θ2 = 0.7, θ3 = 0.1, полученный с помощью программы, а на Рис. 2 динамику удельных долей x1, x2, x3.
Рис.1 Фазовый портрет системы |
Рис.2 Динамика удельных долей xi |
16
Результаты, полученные аналитически, подтверждаются работой программы. Рассмотренный случай модели, описывает процесс близкий к дарвиновскому естественному отбору, но без фактора наследственности - субъекты не размножаются, передавая свою стратегию потомкам. Так же данную модель можно трактовать следующим образом. Пусть наша система - обычное производство, например деталей для автомобилей. Тогда в роли субъектов могут выступать обычные работники на производстве (рабочая сила), которые не очень то и хотят задумываться о чём-то, а просто выполняют свою работу (не меняют свою стратегию).
17
4.2. Модификация модели с подражанием
Можно указать другой социальный, механизм, заменяющий наследование, - подражание. Предположим, что при смене стратегии субъект руководствуется с вероятностью
ε, ε [0; 1) априорными представлениями θi, а с вероятностью 1 − ε - популярностью данной стратегии среди других субъектов:
pi(t) = εθi + (1 − ε)xi(t).
Система (3.7) в этом случае принимает вид:
n |
|
|
|
|
j |
|
|
|
(4.3) |
x˙i = −ωixi − (εθi + (1 − ε)xi(t)) |
−ωjxj, i = 1, n. |
|||
=1 |
|
|
|
|
Как показывает численный эксперимент (Рис.3, Рис.4), при малом фиксированном
ε = 0.3 и параметрах: n = 3, ω = (0.1, 0.3, 0.2), θ = (0.1, 0.1, 0.8) выбора определенного поведения субъектов не происходит, но стратегия с наименьшей ”частотой неудач” (ω1) становится заметно популярнее других:
Рис.3 Фазовый портрет системы |
Рис.4 Динамика удельных долей xi |
18
4.3. Случай чистого подражания
Теперь допустим что ε = 0, тогда субъект при переходе на i-ю стратегию, руководствуется популярностью i-й стратегии среди других субъектов, то есть вероятность перехода на i-ю стратегию равна: pi(t) = xi(t). В данном случае система (3.7) принимает вид:
n |
|
|
|
|
j |
|
|
|
(4.4) |
x˙i = −ωixi − xi |
−xjωj, i = 1, n. |
|||
=1 |
|
|
|
|
Если при любых начальных условиях выбор с течением времени субъекты выбирают один и тот же вариант поведения (не уменьшая общности можно считать его первым), то модель выбора по определению является системой отбора. Так как выполняется следующий интегральный критерий:
t0 |
t |
− |
−xj |
dt = +∞, j = 1, n, j ̸= 1, |
(4.5) |
|||
−x1 |
||||||||
|
|
ω1x1 |
|
ωjxj |
|
|
|
|
то она является системой строгого отбора. Таким образом, вне зависимости от начальных условий со временем удельная доля субъектов, использующих вариант, которому соответствует минимальная "частота неудач" ωi, стремится к единице. Аналитические результаты, подтверждаются работой программы при параметрах: n = 3, ω = (0.1, 0.3, 0.2), так как минимальная "частота неудач" у первой стратегии, соответственно отбирается стратегия v1:
Рис.5 Фазовый портрет системы
Рис.6 Динамика удельных долей xi
19