Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Стохастический_мир.pdf
Скачиваний:
112
Добавлен:
16.03.2016
Размер:
2.96 Mб
Скачать

22

Глава 1.

1.4Зависимость и независимость

Величины являются статистически независимыми, если их совмест-

ная плотность вероятности равна произведению функций, соответствующих распределениям каждой из величин:

P (x; y) = P1(x) P2(y) :

Мы часто будем опускать индексы и использовать одну и ту же букву для обозначения различных функций, отличая их аргументами.

Из определения (1.17) следует, что для независимых событий условная плотность P (x ) y) = P (y) зависит только от y. Это соотношение может

быть ещ¼ одним определением независимости событий. Если вероятность события y не зависит от того, произошло или нет x, то они независимы.

Среднее произведение независимых величин равно произведению их

средних:

1

hx yi = Z

x y P (x)P (y) dxdy = hxi hyi :

 

1

 

 

Поэтому ковариация cov(x; y):

 

cov(x; y) = h(x x)(y y)i = hxyi hxi hyi

(1.19)

независимых величин нулевая. Обратное может быть и неверным ( l C7).

Функция z = f(x; y) двух случайных величин x и y также является случайной величиной с некоторым распределением P (z). Чтобы его най-

ти, необходимо так преобразовать формулу для вычисления среднего от произвольной функции F (z), чтобы получился интеграл только по z:

1

1

 

Z

Z

 

 

 

 

hF (z)i = F

f(x; y) P (x; y) dxdy = F (z)P (z) dz:

(1.20)

1

1

 

Например, если x и y независимые гауссовы числа с произвольными волатильностями x, y, то величина z = x + y тоже гауссова:

1

F x + y e x

=2 x

y

=2 y

2 x y

=

1

F (z)e z

=2

 

p2 ;

hF (z)i = Z

Z

 

 

 

 

 

2

2

2

2

dxdy

 

 

2

 

2

dz

1

 

 

 

 

 

 

 

1

 

 

 

 

 

ãäå 2 = x2 + y2

. В двойном интеграле делается замена z = x + y, u = x,

и проводится интегрирование по

u при помощи формулы (14) íà ñòð.

312 приложения М. Таким образом, сумма двух нормальных величин оказывается нормально распредел¼нной величиной .

Случайные события

23

Пусть x и y две случайные независимые величины с произвольным распределением. Рассмотрим z, являющуюся их суммой z = x + y. Оче- видно, что среднее равно сумме средних z = x + y. Найд¼м дисперсию:

z2 = (z

 

)2

 

= (x

 

+ y

 

)2

= x2 + y2 + 2 h(x

 

) (y

 

)i ;

z

x

y

x

y

где под знаком

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

среднего мы возвели в квадрат и ввели волатильности

ñèìû, òî êîâàриация мåæäó íèìè

 

 

 

 

 

 

 

 

 

каждой величины, например,

x2 =

(x x)2

. Если (!) x и y незави-

 

 

 

 

 

 

 

 

 

 

 

(последнее слагаемое) равна нулю:

h(x

 

) (y y)i = hx xi hy yi = 0. Следовательно:

 

 

x

 

 

 

 

 

 

 

 

 

 

2

= 2

+ 2:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

 

 

x

y

 

 

 

 

 

 

 

В общем случае для суммы n независимых величин:

 

 

z = x1 + ::: + xn

=>

 

 

2

= 2

+ ::: + 2:

(1.21)

 

 

 

 

 

 

 

 

 

 

 

 

z

 

1

 

n

 

 

Для доказательства необходимо рассмотреть x1 +x2 как одну случайную величину и, добавив к ней x3, получить z2 + 32 = 12 + 22 + 32, è ò.ä.

Если волатильности каждого xi одинаковы и равны 0, то волатиль-

ность их ñуммы будет увеличиваться с ростом числа слагаемых, как

p

. Эта зависимость в виде корня исключительно важна и лежит

z = 0

n

в основе всех тех свойств шума Noise, который мы планируем добавлять к детерминированным дифференциальным уравнениям.

Обратим внимание, что полученный результат (1.21) не зависит от ви- да распределения величин xi. Они могут быть даже различными. Главное они должны быть независимыми.

Аналогичный результат мы получили и для суммы двух независимых распредел¼нных по Гауссу чисел. Однако при этом плотность вероятности суммы также оказалась гауссовой. Случайная величина z называется

бесконечно делимой, если е¼ можно представить в виде суммы независимых случайных чисел, имеющих такое же распределение, как и z (воз-

можно с другими параметрами). Примером бесконечно делимого распределения является плотность вероятности Гаусса, а также распределения Коши и гамма - функции, рассматриваемые в следующем разделе.

На самом деле для бесконечной делимости достаточно, чтобы у всех тр¼х величин в z = x+y было одинаковое распределение. При этом, есте-

ственно, подразумевается одинаковая функциональная форма распределения. Его параметры (в частности, волатильность) будут различными. Вообще, для произвольно распредел¼нных чисел их сумма имеет распределение, отличное от распределения каждого из слагаемых. Однако (1.21) для независимых величин выполняется в любом случае и является очень общим результатом.

24

Глава 1.

Простейшая связь между двумя случайными величинами x и y это линейная зависимость y = + x. В общем случае может существовать третья случайная величина , которую мы интерпретируем, как внешний случайный шум. Результирующая модель с константами и имеет вид:

y = + x + :

(1.22)

С этого уравнения обычно начинается поиск связей между эмпирическими величинами.

Обычно считают, что среднее шума равно нулю h i = 0. В противном случае его можно включить в параметр . Потребуем, чтобы дисперсияшума (ошибка модели) была минимальной:

2 = 2 = (y x)2 = min:

(1.23)

Взяв производные по и , можно (l H5) найти уравнение регрессионной прямой. Е¼ наклон равен:

=

hxyi hxi hyi

=

h(x x)(y y)i

:

(1.24)

hx2i hxi2

x2

 

 

 

 

Итоговое уравнение мы запишем в симметричном виде пропорциональности безразмерных отклонений величин от своих средних:

y y

= (x; y)

x x

+

 

:

(1.25)

y

 

 

 

x

y

 

Коэффициент этой пропорциональности называется корреляцией:

xy = (x; y) =

cov(x; y)

:

(1.26)

 

 

x y

 

Âего числителе находится ковариационный коэффициент (1.19). Корреляция ( 6= 0) между двумя величинами x, y не всегда означает

наличие причинной связи y = f(x) или x = g(y). Например, может существовать третья величина z, влияющая и на x, и на y, синхронизируя

их поведение. Так, спад мировой экономики оказывает одинаковое воздействие на две не связанные друг с другом экспортно-ориентированные отрасли экономики. Ложная корреляция возникает также, если две величины имеют явно выраженный восходящий или нисходящий тренд (систематический рост или спад). В этом случае между ними будет появляться заметная корреляция. Эта корреляция характеризует наличие детерминированной составляющей роста ( l C8).

Случайные события

25

Корреляционный коэффициент определяет наклон регрессионной

прямой. Однако важнее то, что он служит мерой прогностических возможностей линейной модели. Покажем это, подставив в значение наклона (1.24) исходное уравнение (1.22). Ó÷ò¼ì, ÷òî h i = 0 è y = + x:

 

=

h(x x)( (x x) + )i

= +

hx i

:

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

x

 

 

x

 

 

Поэтому hx i = 0, что позволяет нам вычислить дисперсию y:

 

y2 = (y y)2 = ( (x x) + )2

= 2 x2 + 2

:

Òàê êàê

= (x; y) y= x,

 

 

 

 

 

 

 

получаем выражение для

относительной

ошибки модели:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E =

 

= p1 2(x; y):

 

(1.27)

 

 

y

 

Значение волатильности шума 2 = 2 можно рассматривать как ошиб- ку линейной модели y = + x. Полезно сравнивать е¼ с волатиль-

ностью y, которая является типичной ошибкой тривиальной модели y = y. Мы видим, что такая относительная ошибка E зависит от кор-

реляционного коэффициента. Чем ближе к единице его квадрат, тем меньше ошибка. При нулевом относительная ошибка равна единице,

и, следовательно, линейная модель имеет такую же предсказательную силу, как и тривиальное утверждение о том, что лучшим прогнозом y

будет его среднее значение. Часто говорят о коэффициенте детермина- öèè R2 = 1 E2 = 2. Заметим также, что коэффициент корреляции по

модулю всегда меньше единицы j j 6 1.

Уравнение линейной модели (1.22) может интерпретироваться поразному.

1)Прежде всего, это модель прогнозирования y, если стало известно x (в духе P (x ) y)). В этом случае это внешний шум или ошибка

модели, когда истинная зависимость между x и y не такая простая. В результате шума y всегда оказывается случайной величиной. В отношении x возможны различные ситуации. Например, при изучении кривой спроса x может быть контролируемой и задаваемой исследователем це-

ной товара (например, с равным шагом). В этом случае она детерминирована. Однако разброс в е¼ значениях позволяет формально определить среднее x и волатильность x.

2) Часто бывает, что и x, и y выступают в качестве равноправных слу-

чайных величин. Например, на фондовом рынке ежедневные изменения цен акций двух компаний x и y стохастически связаны друг с другом.

Обе величины случайны и не зависят от исследователя.