Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Диплом Костин С.С

.pdf
Скачиваний:
2
Добавлен:
11.03.2016
Размер:
729 Кб
Скачать

Критерий 4.1 Стратегия vi лучше стратегии vj , если выполняется отношение:

t

 

Fi

 

Fj

dt = +∞

 

n→∞ t0

 

 

(2.6)

xi

xj

lim

 

 

 

 

 

 

Следствие 4.1 Стратегия vi является наилучшей среди допустимых стратегий vj

(vi vj для всех j = 1, n, j ̸= i), если выполняются условия:

 

T

 

Fi

 

Fj

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t0

xi

xj dt = +∞, j = 1, n, j ̸= i.

(2.7)

T →∞

Определение 5. Пусть ξ(t) – непрерывная функция. Если существует предел

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

1

 

t0

ξ

τ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t→∞ t

(

 

)

 

 

 

 

 

 

, тогда

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

1

 

t0

ξ

 

τ

(2.8)

 

 

 

 

 

 

 

 

 

 

ξ = t→∞ t

(

)

 

 

 

называется временным средним функции ξ(t).

Замечание 5.1 Если непрерывная функция ξ(t) имеет предел при t → ∞, то его

временное среднее значение совпадает со значением этого предела.

 

 

ξ

 

lim

t

ξ (τ) dτ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Легко видеть, что

 

= t→∞

 

 

t

 

 

, как это следует из правила Лопиталя.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fi

Fj

Следствие 5.1 Пусть существуют временные средние

 

и

 

 

, различные

xi

xj

для разных стратегий. Тогда vi

vj

, если выполняется неравенство:

 

 

 

 

 

 

 

 

F

Fj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

>

 

 

 

(2.9)

 

 

 

 

 

 

 

 

xi

xj

Следствие.5.2 Стратегия vi

является наилучшей среди допустимых стратегий vj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fi

 

 

Fj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(vi vj для всех j = 1, n, j ̸= i), если выполняются неравенства

 

 

>

 

для всех

xi

xj

i ̸= j.

 

 

 

 

 

 

 

 

 

 

 

F

 

 

 

 

 

Таким образом, временное среднее значение

i

является критерием оптимальности

xi

для vi.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Во многих случаях функции Fi имеют вид:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

Fi = Фi(x, t) − xi

Фj(x, t), i =

 

 

 

(2.10)

 

 

 

 

1, n,

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

тогда система (2.2) запишется следующим образом:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

i = Фi(x, t) − xi

Фj(x, t), i =

 

 

(2.11)

 

 

 

 

1, n.

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

10

Для данной системы имеет место интегральный критерий строгого отбора.

Критерий 2. Для того, чтобы система (2.11) являлась системой строго отбора,

необходимо и достаточно, чтобы вдоль любой фазовой траектории системы (2.11), со-

n

ответствующей начальным условиям xi(t0) = x0, x0 ≥ 0, xi = 1, i = 1, n , удовлетво-

i=1

ряющим неравенствам: 0 < x0i < 1, были справедливы равенства:

+∞

t, x t

))

 

t, x t

))

 

 

 

 

 

 

t0

 

Ф1( (

Фi( (

dt = +∞

 

 

 

(2.12)

x1

 

xi

 

 

 

 

В этом случае имеет место приведенное ниже свойство.

 

 

 

 

Следствие 2.1 Пусть существуют временные средние

Фi

 

и

Фj

. Тогда vi vj,

xi

xj

если выполняется неравенство:

 

 

> xj

 

 

 

 

 

 

(2.13)

 

 

xi

 

 

 

 

 

 

 

 

Фi

Фj

 

 

 

 

 

 

 

 

для всех j = 1, n, i ̸= j.

11

3. Модель И.Г. Поспелова

3.1. Дискретная модель И.Г. Поспелова

Принимая решения, исполняющий данную роль субъект старается выбрать наилучшее с его точки зрения решение, то есть действует в своих интересах. Эти интересы не обязательно считать сугубо эгоистическими: субъект может искренне стремиться, например, к благу всего человечества. Важно другое, если роль производителя будут часто занимать субъекты, стремящиеся, скажем, провести, как можно больше социологических конференций, производство вряд ли будет работать. Мотивы и роли должны быть взаимно согласованы. Заметим, что в моделях экономики такое согласование обычно принимается, как самоочевидное: производитель максимизирует прибыль (или стремится выполнить план), потребитель максимизирует полезность своего потребления и т. п. Опишем на языке мотивации субъекта с помощью абстрактной модели результат действия ”частот неудач” каждой стратегии, то есть механизмов отбора, поддерживающих согласование ролей и интересов. Рассмотрим некую роль, которую можно исполнять одним из некоторого конечного множества способов (стратегий) M. Данную роль в экономике исполняют параллельно множество S субъектов. В типичном для экономике случае мощность множества

M составляет от десятков тысяч до миллионов субъектов. Субъекты используют разные стратегии. Обозначим через sk(t) число субъектов, использующих стратегию k в момент времени t. Распределение субъектов по стратегиям:

s¯(t) = sk(t) : k M, sk(t) ≥ 0,

sk(t) = S

,

(3.1)

 

 

 

 

k M

нашей модели характеризует состояние рассматриваемой системы.

Предположим, что в течение малого промежутка времени ∆ субъект, использующий стратегию k, независимо от предыстории и действий других субъектов с вероятностью

ωk∆(t) + o(∆t) подпадает под действие упомянутых механизмом отбора поведения и оказывается вынужденным сменить свою стратегию. Набор постоянных ”частот неудач” ωk

характеризует в модели среду, в которой субъекты исполняют свою роль. Предполагается, что субъекты не осознают связь между стратегией и частотой неудачи или игнорируют ее. Например, модель допускает случай, когда субъект вовсе не хочет исполнять данную роль и не интересуется результатом своей деятельности. Будем считать, что субъект, изменяющий свою стратегию, выбирает новую i-ю с вероятностью pi(t):

pi(t) : i M, pi(t) ≥ 0, pi(t) = 1,

i M

возможно зависящей от состояния s¯(t) , но не зависящей от предыстории процесса.

12

Можно также, считать, что субъект, потерпевший неудачу, ”выбывает из игры”, и его место занимает новый, выбирающий свою стратегию с вероятностью pi(t). Таким образом, динамика системы описывается марковским процессом:

 

Sk(t), с

вероятностью (ωk∆ + o(∆)) i M pi(t), i ̸= k,

 

 

S (t) + 1,

 

 

 

 

 

(3.2)

Sk(t + ∆) =

 

 

(ω ∆ + o(∆))p (t), i = k, .

 

 

 

 

 

 

 

̸

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

с

вероятностью

i

k

 

 

 

Sk(t) − 1, с

вероятностью

k∆ + o(∆))pi(t), i ̸= k.

 

 

 

 

 

 

 

 

 

 

Рассмотрим простейший случай, когда pi(t) = θk = const. Такое предположение соответствует случаю, когда субъекты ничему не обучаются, а исполняют роль в соответствии с априорными представлениями о ней, выработанными, например, в процессе общей социализации индивидуума. В этом случае описанный марковский процесс приходит к стационарному состоянию, в котором при большом S численности s(t) будут практически равны своим средним значениям:

 

 

pkS

 

 

 

 

ωk

(3.3)

Esk =

 

 

 

.

 

pj

 

 

 

 

 

j M ωj

Это соотношение показывает, что при постоянных pk(t) выработки определенного поведения в системе не происходит. Численности соответствуют априорным вероятностям, ”перекошенным” в соответствии с частотами неудач. Рассмотренный случай модели, описывает процесс близкий к дарвиновскому естественному отбору, но без фактора наследственности - субъекты не размножаются, передавая свою стратегию потомкам.

Предположим, что при смене стратегии субъект руководствуется с вероятностью ε,

0 ≤ ε < 1 априорными представлениями θi, а с вероятностью 1 − ε - популярностью данной стратегии среди других субъектов:

pi(t) = εθi + (1 − ε)

si(t)

(3.4)

S .

Получающийся при этом предположении модель задает, так называемый, ”нелинейный ветвящийся процесс”. В данном случае удается доказать следующую теорему.

13

Теорема 1. Eсли S → ∞ , а ε → 0 так, что величина Nε4 отделена от 0, то независимо от начального состояния с течением времени почти все субъекты будут использовать стратегии из множества:

Q = argminωk,

(3.5)

k K

 

то есть стратегии с минимальной частотой неудачи. Именно, вероятность, того, что

 

1

 

1

ε

 

 

 

C exp−Ωt +C

ε

C

C

доля субъектов,

 

 

nk

(t) , использующих стратегии с минимальной частотой неуда-

 

N

k Q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чи, окажется меньше

 

, не превосходит величины 1

2

 

, где

1 и 2

– положительные постоянные, не зависящие от S, ε, а Ω – обусловленность минимума

 

 

 

 

 

 

minω

 

 

 

 

 

частоты неудачи: Ω = minωk k

 

M k.

 

 

 

 

 

 

 

 

k K\Q

 

 

 

 

 

 

 

Выше мы рассматривали субъектов, одинаковых в том смысле, что они имеют совпадающие априорные вероятности выбора стратегий. Теорема обобщается на случай, когда у разных субъектов величины θk различны. При утверждение теоремы неверно. В рассматриваемом процессе с конечными вероятностями возникают состояния, когда ни один субъект не использует некоторую стратегию. В случае ”чистого подражания” ε = 0 эти состояния будут поглощающими. Приведенная теорема позволяет сделать вывод, что подражание распространенным образцам приводит к выделению поведения, минимизирующего вероятность неудачи. Таким образом, для внешнего наблюдателя сочетание механизмов отбора и подражания будет выглядеть, как наличие у субъектов мотивации минимизировать вероятность неудачи в исполнении роли, независимо от личного отношения субъектов к роли и стратегии. То есть эта мотивация носит объективный характер, в том смысле, в каком говорил об объективных интересах К. Маркс.

Выше было сказано о подражании, как о специфически социальном механизме, не исключено, что аналогичный процесс идет и биосфере благодаря переносу генов. Теорема показывает, что характерное время выделения оптимального поведения составляет величину порядка Ω−1. Предположим, что частоты неудач ωk время от времени перестраиваются, причем так, что в каждый момент имеется единственная стратегия с минимальной частотой неудач, а обусловленность минимума Ω не меняется. Тогда наблюдаться будет не одна стратегия, а целый спектр, содержащий τΩ стратегий, где τ характерное время смены номера оптимальной стратегии. Этот означает, что рассмотренный процесс автоматически поддерживает соответствие между разнообразием среды и разнообразием поведения. Представляется, что так можно объяснить вспышки мутаций, возникающие в биоценозах в ответ на резкие изменения окружающей среды.

14

3.2. Обобщение модели И.Г. Поспелова на непрерывный случай

Обозначим xi = si/S, i = 1, n – удельные доли числа субъектов, осуществляющих выбор стратегии. Введем обозначение x(t) = (x1, x2, ..., xn). Тогда при сделанных предположениях динамика изменения числа субъектов, выбирающих ту или иную стратегию, представляет случайный процесс. Принятые гипотезы определяют динамику выбора состояний как случайный процесс. Введем в рассмотрение квадратную матрицу переходов размерности n на n. Каждый ее элемент, стоящий в i-й строке и j-м столбце имеет смысл вероятности перехода за время ∆t от i-го варианта поведения к j-му. Диагональный эле-

мент, стоящий на i-м месте, имеет смысл сохранения за время ∆t числа субъектов si.

Матрица переходов имеет вид:

 

 

n

 

 

 

(pn(t)ω1∆t) + o(∆t)

 

 

 

1 − j=2(pj(t)ω1∆t) + o(∆t) · · ·

 

 

 

 

 

· · ·

 

 

 

.

 

Π(t, ∆t) =

(p1(t)ω2∆t) + o(∆t)

 

(pn(t)ω2∆t) + o(∆t)

 

 

 

..

..

.

 

 

..

 

(3.6)

 

 

.

 

 

n

.

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

(p1(t)ωn∆t) + o(∆t)

· · ·

1

 

(pj(t)ω1∆t) + o(∆t)

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вектора x(t) и x(t + ∆t) связаны соотношением x(t + ∆t) = x(t)Π(t, ∆t), отсюда:

∆xi = xi(t + ∆t) − xi(t) = 1 − (xjpi(t)ωj∆t) + o(∆t)

j̸=i

Получим динамику изменения удельных долей числа субъектов, использующих стратегию vi, i M в момент времени t:

n

 

 

 

 

j

 

 

 

(3.7)

i = −ωixi − pi(t)

−ωjxj, i = 1, n.

=1

 

 

 

 

n

Сумма правых частей будет равна нулю, когда pi(t) = 1, следовательно при этом

i=1

условии данная система является системой на стандартном симплексе.

15

4. Исследование модификаций непрерывной модели

4.1.Модификация модели с постоянными значениями вероятностей

Как было сказано в главе 3.1, при pi(t) = θi = const субъекты ничему не обучаются, а исполняют роль в соответствии с априорными представлениями о ней. В этом случае

динамика приходит к состоянию, в котором при большом S численности sk(t) будут прак- pk

 

 

 

ωk

 

тически равны своим средним значениям: xk =

. Соотношение показывает, что при

pj

 

 

 

 

 

 

 

j M ωj

постоянных pk выработки определенного поведения в системе не происходит. Численности соответствуют априорным вероятностям θk, ”перекошенным” в соответствии с частотами неудач.

Исследуем систему:

n

 

 

 

 

j

 

 

 

(4.1)

i = −ωixi − θi

−ωjxj, i = 1, n,

=1

 

 

 

 

аналитически в случае n = 3 при ω1 = 1, ω2 = 1, ω3 = 1, θ1 = 0.2, θ2 = 0.7, θ3 = 0.1. Имеем систему:

Так как система является системой на стандартном симплексе, с помощью замены x3 = 1 − x1 − x2 можно перейти к системе 2-ух уравнений. Решив её методом Гаусса было найдено состояние равновесия (особая точка) с координатами (0.2, 0.7, 0.1). Теперь

составим Якобиан усеченной системы

ДУ:

 

 

−1

− λ 0

= 0.

(4.2)

0−1 − λ

Полученные собственные числа матрицы Якоби λ1, λ2 < 0, значит делаем вывод: состояние равновесия является устойчивым узлом. На Рис. 1 можно видеть фазовый портрет системы в случае n = 3 при ω1 = 1, ω2 = 1, ω3 = 1, θ1 = 0.2, θ2 = 0.7, θ3 = 0.1, полученный с помощью программы, а на Рис. 2 динамику удельных долей x1, x2, x3.

Рис.1 Фазовый портрет системы

Рис.2 Динамика удельных долей xi

16

Результаты, полученные аналитически, подтверждаются работой программы. Рассмотренный случай модели, описывает процесс близкий к дарвиновскому естественному отбору, но без фактора наследственности - субъекты не размножаются, передавая свою стратегию потомкам. Так же данную модель можно трактовать следующим образом. Пусть наша система - обычное производство, например деталей для автомобилей. Тогда в роли субъектов могут выступать обычные работники на производстве (рабочая сила), которые не очень то и хотят задумываться о чём-то, а просто выполняют свою работу (не меняют свою стратегию).

17

4.2. Модификация модели с подражанием

Можно указать другой социальный, механизм, заменяющий наследование, - подражание. Предположим, что при смене стратегии субъект руководствуется с вероятностью

ε, ε [0; 1) априорными представлениями θi, а с вероятностью 1 − ε - популярностью данной стратегии среди других субъектов:

pi(t) = εθi + (1 − ε)xi(t).

Система (3.7) в этом случае принимает вид:

n

 

 

 

 

j

 

 

 

(4.3)

i = −ωixi − (εθi + (1 − ε)xi(t))

−ωjxj, i = 1, n.

=1

 

 

 

 

Как показывает численный эксперимент (Рис.3, Рис.4), при малом фиксированном

ε = 0.3 и параметрах: n = 3, ω = (0.1, 0.3, 0.2), θ = (0.1, 0.1, 0.8) выбора определенного поведения субъектов не происходит, но стратегия с наименьшей ”частотой неудач” (ω1) становится заметно популярнее других:

Рис.3 Фазовый портрет системы

Рис.4 Динамика удельных долей xi

18

4.3. Случай чистого подражания

Теперь допустим что ε = 0, тогда субъект при переходе на i-ю стратегию, руководствуется популярностью i-й стратегии среди других субъектов, то есть вероятность перехода на i-ю стратегию равна: pi(t) = xi(t). В данном случае система (3.7) принимает вид:

n

 

 

 

 

j

 

 

 

(4.4)

i = −ωixi − xi

−xjωj, i = 1, n.

=1

 

 

 

 

Если при любых начальных условиях выбор с течением времени субъекты выбирают один и тот же вариант поведения (не уменьшая общности можно считать его первым), то модель выбора по определению является системой отбора. Так как выполняется следующий интегральный критерий:

t0

t

xj

dt = +∞, j = 1, n, j ̸= 1,

(4.5)

x1

 

 

ω1x1

 

ωjxj

 

 

 

 

то она является системой строгого отбора. Таким образом, вне зависимости от начальных условий со временем удельная доля субъектов, использующих вариант, которому соответствует минимальная "частота неудач" ωi, стремится к единице. Аналитические результаты, подтверждаются работой программы при параметрах: n = 3, ω = (0.1, 0.3, 0.2), так как минимальная "частота неудач" у первой стратегии, соответственно отбирается стратегия v1:

Рис.5 Фазовый портрет системы

Рис.6 Динамика удельных долей xi

19