Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Диплом / suslov_ibragimov_ekonometrika

.pdf
Скачиваний:
45
Добавлен:
24.03.2015
Размер:
5.55 Mб
Скачать

62

Глава2.Описательная статистика

т.е.он равен простому среднему геометрическому темпу по всем периодам.

В общем случае(при разных τi )данная формула приобр етает вид средневзвешенной геометрической:

 

 

 

 

λø = # x0

$

1

= 4

λøiαi ,

 

 

 

 

 

xN

 

τ

 

 

где

ø

= λ

1/τi

Ñсредний за единицу

времени темп роста в i-м периоде,

λi

i

αi = τ i

"τ .

 

 

 

 

 

 

Для величин типа запаса имеется еще одна форма средних темпов роста:отношение средней хронологической за период времени к средней хронологической занекоторыйпредыдущийпериод.Такую формусреднихможнорассмотретьнаследующем примере.

Пусть x0, x1, x2 Ñзначение величины типа запаса в три момента времени: на начало первого периода,конец первого периода,который одновременно является началом второго периода,конец второго периода.Оба периода времени одинаковы.Средние хронологические за первый и второй периоды времени равны, соответственно,

1 = (1 − α) x0 + αx1, xø2 = (1 − α) x1 + αx2.

 

 

 

 

 

 

 

ø

2

"

 

 

 

λ1 = x0

 

Темп роста средней величины типа запаса

λ =

 

 

 

1

можно выразить через

средниевзвешенныетемповростазакаждыйиздвухпериодоввремени

 

x1

"

,

"

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λ2 = x2 x1

следующим образом:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λø = α11λ1 + α21λ2, где α11 =

(1 − α) x0

, α21 =

 

αx1

, α12 + α21 = 1, или

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

 

 

 

 

λø =

 

1

, где α2

=

(1 − α) x1

, α2

=

 

αx2

, α2

+ α2

= 1.

 

 

 

α2

1 + α22

2

 

 

 

 

1

 

2

2

 

 

 

1

2

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом,темп роста средней хронологической является средней взвешенной арифметической темпов роста заотдельные периоды,есливеса рассчитываются по информации первого периода,или средней взвешенной гармонической, если веса рассчитываются по информации второго периода.

Если коэффициент α,представляющий внутрипериодную динамику,различаетсяпопериодам,т.е.динамикавеличинывразныхпериодахкачественноразлична, то темп роста средней хронологической перестает быть средней арифметической или гармонической темпов роста по периодам,т.к.сумма весов при этих темпах роста не будет в общем случае равняться единице.

В разных ситуациях средние темпы роста могут рассчитываться различным образом,чтоможнопроиллюстрироватьнапростыхпримерах,взятыхиз финансовых расчетов.

2.2.Средние величины

63

В финансовых расчетах аналогом темпа прироста капитала(величины типа запаса) выступает доходность на вложенный(инвестированный)капитал.

Пусть инвестированный капитал x0 в течение периода τ

приносит доход .Тогда

капитал к концу периода становится равным x1 = x0 +

,и доходность капитала за

этот период определяется как

 

 

 

 

 

x1

 

 

δ =

 

=

 

− 1,

т.е.совпадает по форме с темпом прироста.

x0

x0

Средняя за период доходность в зависимости от поведения инвестора(субъекта, вложившего капитал)рассчитывается различным образом.Ниже рассматривается три возможные ситуации.

1)Если позиция инвестора пассивна,и он не реинвестирует полученные доходы в течение данного периода времени,то средняя доходность в единицу времени определяется простейшим способом:

ø= 1

δ.

τx0

"

ФактическиэтоÑсредняя арифметическая простая,т.к. x0 являетсяобщей доходностью за период времени τ .Такой способ расчета средней доходности наиболее распространен.

Эта формула используется и при τ < 1.Так,обычно доходности за разные периоды времени приводятся к среднегодовым,т.е.единицей времени является год.Пусть

речь идет,например,о трехмесячном депозите.Тогда

 

τ

= 0.25,и среднегодовая

доходность получается умножением на4доходности

 

x0

за3месяца.

ø

рассматриваемого периода вре-

2)Пусть доходность в единицу времени δ в течение

 

"

 

 

мени не меняется,но доходы полностью реинвестируются в начале каждой единицы

 

 

 

 

 

 

 

 

 

ø

раз,и для

времени.Тогда за каждую единицу времени капитал возрастает в 1 + δ

нахождения

ø

используется формула:

 

 

 

 

 

δ

#1 + x0 $τ

− 1.

 

 

 

1 + x0 = 1 + δø τ , т.е. δø =

 

 

 

 

 

0

1

1

 

 

 

 

 

 

 

 

 

Эта формула справедлива при целых положительных τ .Действительно(предполагается,чтоначалопериодаинвестированияимеетнаосивременицелуюкоординату), если τ < 1,ситуацияаналогичнапредыдущей,вкоторойиспользуетсяформулапро-

стой средней арифметической.Если

τ не целое,то такая же проблема возникает

для последней,неполной единицы времени в данном периоде.

 

ø

ø

τ

 

 

 

ø

(что следует из раз-

Естественно предположить,что δ < 1,тогда 1 + δ

 

 

> 1 + τ δ

ложения показательной функции в степенной0ряд)и1

 

1

 

 

> δø.

 

 

τ

x0

 

Это соотношение лучше интерпретироватьÇв обратном порядкеÈ:если по усло-

виям инвестиционного контракта ø фиксирована и допускается реинвестирование

δ

64 Глава2.Описательная статистика

доходов в течение периода,чем пользуется инвестор,то фактическая доходность на инвестированный капитал будет выше объявленной в контракте.

3)Пусть в течение данного периода времени доходы реинвестируются n раз через

равные промежутки времени.Тогда для

ø

справедлива следующая формула:

δ

1 + x0

=

#1 + n

$

 

 

 

 

ø

n

 

 

 

 

 

τ δ

 

(она совпадает с предыдущей в случае n = τ ).

Теоретически можно представить ситуацию непрерывного реинвестирования,когда n → ∞.В таком случае

δ = τ

#

 

x0

$

n→∞

#1 + n

$

 

 

 

1

 

 

 

 

 

ø

n

ø

 

ø

 

ln

1 +

 

 

, поскольку lim

 

 

= e

τ δ

.

 

 

 

 

 

 

 

В соответствии с введенной ранее терминологией,этоÑнепр ерывный темп прироста в единицу времени.Данную формулу можно использовать при любом(естественно,положительном) τ .

Понятно,что средние доходности в единицу времени,полученные в рассмотренных трех случаях,находятся в следующем соотношении друг с другом:

 

τ x0

>

#1 + x0 $

− 1 >

τ ln #1 + x0

$.

1

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

τ

 

 

 

 

пассивное

 

дискретное

 

непрерывное

 

поведение

 

реинвестирование

реинвестирование

Это соотношение при интерпретации вÇобратном порядкеÈозначает,что чем чаще реинвестируется доход,тем выше факт ическая доходность на первоначальный капитал.В финансовых расчетах для прив едения доходностей к разным единицам времени используется1-я формула.

Теперь рассматривается общий случай с N + 1 моментом времени и расчетом средней доходности за N подпериодов.

1)Если позиция инвестора пассивна в течение всего периода времени,то средняя доходность в i-м подпериоде и в целом за период равны:

 

ø

1 i

ø

 

1

 

 

 

 

δi =

 

 

 

, δ

=

 

 

 

,

 

τi x0

τ x0

N

i = xN − x0

 

 

 

 

 

где i = xi − xi−1, = %

и τi определены выше).Средняя

i=1

доходность в целом за период удовлетворяет формуле средней взвешенной арифметической:

δø = !αi δøi, где αi =

τ

i

.

τ

2.2.Средние величины

 

 

 

 

 

 

 

 

 

65

2)Пусть теперь доходы реинвестируются в начале каждого подпериода времени.

 

 

 

 

 

 

 

 

ø

ø

1

 

i

 

 

Тогда в течение i-го подпериода капитал вырастает в 1 + τi δi раз,где δi =

τ

 

x

.

Если предположить,что все подпериоды имеют одинаковую длину

 

i

 

i−1

 

τø,то в среднем

 

за подпериод доход вырастает в

 

øi

11

1/N

раз,и это количество раз равно

 

1 + τøδø.Поэтому

 

0301 + τøδ

 

 

− 1$.

 

 

 

 

 

 

δø = τø

#

1 + τøδøi

 

 

 

 

 

 

 

 

1

 

(40

 

1)

1/N

 

 

 

 

 

 

Это формула простой средней приведенного выше общего вида f −1 0 1 %f (xi )1,

где f = ln (1 + x).

N

Аналогичную формулу можно использоватьи вслучаеподпериодов разной длины τi :

δø = τø #(401 + τiδøi

1)

1

− 1$, где τø =

N !τi .

1

 

 

N

 

1

 

Фактически эти формулы являются вариантами формул простой средней геометрической.

3)Пусть теперь все τi являются целыми положительными числами,и реинвестирование доходов происходит в начале каждой единицы времени.Тогда

δøi = 1 +

 

i

$

1"τi

1, δø = 1 +

 

 

1"τ

1.

x

i−1

x

0

#

 

#

 

$

 

Средняя в единицу времени доходность в целом за период равна средней взвешенной

геометрической средних доходностей по подпериодам:

= τi .

 

δø =

401 + δøi1 i − 1,

где αi

 

 

 

 

α

 

 

 

τ

 

4)Наконец,в теоретическом случае непрерывного инвестирования

δøi = τi

ln #1 + xi−i1 $, δø =

τ ln #1 + x0

$,

1

 

 

 

 

1

 

 

 

 

 

и средняя доходность за весь период,как и в первом случае,равна средней взвешенной арифметической средних доходностей по подпериодам:

ø = ! ø где = τi

δ αi δi, αi τ .

В заключение этого раздела следует отметить,что особую роль в статистике играют средние арифметические.Именно они выступают важнейшей характеристикойраспределенияслучайныхвеличин.Так,вобозначенияхпредыдущегопункта

величину xø = αi xi можно записать как xø =

xifi

i или,при использовании

функции плотности распределения,как

xø =

/

x f (x) dx

.

теоретической%

%

 

 

(zlÐ1+ l)
Рис. 2.8
F1 0.5
FlÐ1

66

Глава2.Описательная статистика

Теоретическое арифметическое среднее,определенное последней формулой, называется в математической статистике математическим ожиданием.Математическое ожидание величины x обозначают обычно как E(x),сохраняя обозначение xø для эмпирических средних(см.ПриложениеA.3.1).

2.3.Медиана,мода,квантили

Модаимедиана,нарядусосредней,являютсяхарактеристикамицентрараспределенияпризнака.Медиана,обозначаемаявданномтекстечерез x0.5, Ñвеличина (детерминированная),котораяÇделитÈсовокупность пополам.Теоретически она такова,что

x-0.5 +-

f (x) dx = f (x) dx = 0.5,

−∞

x0.5

где f (x) Ñфункция распределения(см.ПриложениеA.3.1).

По выборочным данным x1, . . . , xN ,упорядочен-

ным по возрастанию,за нее принимается x(N +1)/2 в случае,если N нечетно,и (xN/2 + xN/2+1)/2,если N четно.

Значение медианы может быть уточнено,если по данным выборки построено эмпирическое распре-

zlÐ1 x0.5 zl деление частот zl , l = 0, . . . , k, l , αl , fl, Fl , l = = 1, . . . , k.Пусть l-й полуинтервал является меди-

анным,т.е. Fl−1 < 0.5 ! Fl .Тогда,линейно интерполируя значения функции распределения F на этом

полуинтервале,медиану определяют по следующей формуле:

x

 

= z

+

 

0.5 − Fl−1

.

 

0.5

l−1

 

l

αl

Ее смысл поясняется на графике(рис. 2.8).Этот график является фрагментом кумуляты.

o

Мода,обозначаемая в данном тексте через x,показывает наиболее вероятное значение признака.ЭтоÑзначение величины вÇпикеÈфункции плотности распределения вероятности(см.ПриложениеA.3.1):

(o )

f x = max f (x).

x

2.3.Медиана,мода,квантили

 

 

 

 

 

 

 

 

 

 

 

 

 

 

67

Величины с унимодальным распределением имеют одну моду,полимодальные

распределения характеризуются несколькими модами.Непосредственно по вы-

борке,если все ее значения различны,величину моды определить невозможно.

Если какое-то значение встречается в выборке несколько раз,то именно егоÑ

по определениюÑпринимают за моду.В общем случае моду ряда наблюдений

находят по данным эмпирического распреде-

 

 

 

 

 

 

 

 

 

 

 

ления частот.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть l-й полуинтервал является модаль-

 

 

 

 

 

 

 

 

 

 

 

ным,т.е. fl > fl−1 и fl > fl+1 (во избежание

f1

 

 

 

 

 

 

 

 

 

 

непринципиальных уточнений случайÇ " Èне

fl+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рассматривается).Функция плотности веро-

flÐ1

 

 

 

 

 

 

 

 

 

 

ятности аппроксимируется параболой,прохо-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

дящей через середины ступенек гистограммы,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и ее максимум определяет положение искомой

 

 

 

 

 

 

 

 

 

 

 

моды.График(рис. 2.9)поясняет сказанное.

 

 

z

 

z

 

z

 

1

Ð

z

 

 

 

lÐ2

lÐ1

l

x2

l+1

 

 

 

 

 

 

 

 

 

 

2 Ð

m22

 

В случае если размеры полуинтервалов

 

 

1,

 

 

 

 

 

 

 

x2

 

 

l

 

 

Ð

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

l и

l+1 одинаковы и равны

,такая про-

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

цедура приводит к определению моды по фор-

 

 

 

Рис. 2.9

 

 

 

 

 

 

муле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

o

 

fl

− fl−1

 

 

.

 

 

 

 

 

 

 

 

x= zl−1 +

 

 

 

 

 

 

 

 

 

 

 

 

(fl − fl−1) + (fl − fl+1)

 

 

 

 

 

 

 

 

В справедливости этой формулы несложно убедиться.Действительно,коэффициенты a, b и c аппроксимирующей параболы ax2 + bx + c удовлетворяют следующей системе уравнений:

axø2

 

 

+ bxø + c = f ,

a(øxl−1

+ )2

+ b(øxl−1

+ ) + c = fl ,

l

1

 

l 1

 

l−1

 

 

 

 

 

 

a(øxl

 

1

+ 2 )2 + b(øxl

 

1 + 2 ) + c = fl+1.

Если из второго уравнения вычесть первое,а затем третье,то получится более простая система из двух уравнений:

;(a(2øxl−1 + ) + b) = fl − fl−1, (a(−2øxl−1 − 3 ) − b) = fl − fl+1.

Первое из этих уравнений дает выражение для b через a :

b =

fl − fl−1

− a (2øxl−1

+

) ,

 

а их суммаÑвыражение для определения параметра

a :

−2a 2 = (fl − fl−1) + (fl

− fl+1).

68

 

Глава2.Описательная статистика

Очевидно,что a отрицательно,и поэтому парабола имеет максимум в точке −b 2a

(в этой точке производная

2ax + b

o

=

b

 

 

 

 

подстановки

равна нулю),т.е. x

2a ,и после

 

 

 

 

"

сюдаполученных выраженийдля b и a,учитывая,что xø

 

"+

 

= z

l−1

,получается

 

2

искомая формула.

 

 

l−1

 

 

 

 

 

 

 

 

 

 

 

 

Все три характеристики центра распределения:мода,медиана,среднееÑнаходятся в определенных соотношениях между собой.

В случае идеальной(теоретически)симметрии

f (x0.5 + ) = f (x0.5 − )

(2.5)

при любом " 0,все эти три характеристики совпадают.

Доказательство этого утверждения проводится для теоретической функции плотности распределения f (x),в предположении,чтоона являетсягладкой,т.е.непрерывной и непрерывно дифференцируемой.

Дифференцирование выражения(2.5)по в точке 0 дает условие f " (x0.5) = = −f " (x0.5),из чего,в силу непрерывной дифференцируемости f ,следует равенство нулю производной в точке x0.5. И поскольку распределение унимодально, то мода совпадает с медианой.

Теперь доказывается совпадение математического ожидания с медианой.Для случайной величины x −x0.5 с той же функцией распределения плотности f (x),в силу

 

+∞

 

того,что

f (x) = 1,имеет место следующее тождество:

 

−∞

 

 

/

 

 

 

+∞

 

E (x) − x0.5 =

- (x − x0.5) f (x) dx.

−∞

Егоправаячастьразбиваетсянадваслагаемыхипреобразуетсяследующимобразом:

E(x) − x0.5 =

-

(x − x0.5) f (x) dx +

-

(x − x0.5) f (x) dx =

 

x0.5

 

+∞

 

−∞

 

x0.5

 

(в первом слагаемом производится замена переменных x − x0.5 = − и переста-

 

 

0

+∞

 

новка пределов интегрирования +/→ −

/0

,во2-м слагаемомÑзамена пере-

менных x − x0.5 =

)

f (x0.5 − ) d +

-0

 

= −

-0

f (x0.5 + ) d =

 

+∞

 

+∞

2.3.Медиана,мода,квантили

69

(вводя соответствующие обозначения)

 

= −A+ A+.

(2.6)

Поскольку выполнено условие симметричности распределения(2.5),

A= A+

и математическое ожидание(среднее)совпадает с медианой.Это завершает рассмотрение случая симметричных распределений.

Для асимметричных распределений указанные три характеристики различаются,но так,что медиана всегда находит ся между средней и модой.При правой асимметрии

o

x < x0.5 < x,ø

при левой асимметрии,наоборот,

o

xø < x0.5 <x .

В этом легко убедиться.Пустьречьидет,например,оправой асимметрии.Распределение скошено в сторону больших значений случайной величины-признака,поэтому A< A+ (это соотношение можно рассматривать в качестве определения правой асимметрии),и,в силу выполнения тождества(2.6),среднее должно превышать медиану: x0.5 < E(x), (x0.5 < xø).

Условие A< A+ может выполняться только в случае,если при достаточно больших имеет место неравенство f (x0.5 + ) > f (x0.5 − ) (веса больших значений признака больше,чем веса равноудаленных от медианы малых значений). Но тогда для малых ,т.е.в окрестности медианы,должно иметь место обратное

+∞

 

+∞

 

неравенство(поскольку /0

f (x0.5 − ) d

= /0

f (x0.5 + ) d =0 .5):

f (x0.5 − ) > f (x0.5 + ) ,

o

а это означает,что мода смещена влево от медианы: x < x0.5 .

Проведенное рассуждение о положении моды относительно медианы не является строгим,оно предполагает как быÇплавныйÈпереход от симметрии к правой асимметрии.При строгом доказательстве существенную роль играет предположение об унимодальности распределения.

Случай левой асимметрии рассматривается аналогично.

Для больших выборок,как правило,подтверждается еще одно утверждение об относительном расположении трех рассматриваемых характеристик:при умереннойасимметриимодаудаленаотмедианынарасстояниеприблизительнов 2 раза большее,чем среднее.То есть

2x −x0.5

2

≈ 2 |xø − x0.5 |.

2

o

2

 

2

 

2

 

x0.5

70

Глава2.Описательная статистика

 

Для того чтобы легче запомнить приведенные здесь соотношения,можно ис-

пользовать следующеемнемоническое правило.Порядокследования среднего,медианы и моды(при левой асимметрии)такой же,как слов mean, median, mode

ванглийском словаре(при правой асимме трии порядок обратный).Причем,как и соответствующие им статистические характеристики,слово mean расположено

всловаре ближе к median,чем mode.

Квантилем называют число(детерминированное),делящее совокупность

в определенной пропорции.Так,квантиль xF (используемое в данном тексте обозначение квантиля)делит совокупнос ть в пропорции(верхняя часть к нижней) 1 − F к F (см.ПриложениеA.3.1):

-xF

P (x ! xF ) = F или F (xF ) = f (x) dx = F .

−∞

В эмпирическом распределении все границы полуинтервалов являются квантилями: zl = xFl .По данным этого распределения можно найти любой квантиль xF с помощью приема,использованного выше при нахождении медианы.Если l-й

полуинтервал является квантильным,т.е.

Fl−1 < F ! Fl ,то

x

 

= z

+

F − Fl−1

.

 

F

l−1

 

l αl

Иногда квантилями называют только такие числа,которые делят совокупность на равные части.Такими квантиля ми являются,например,медиана ,делящая совокупность пополам, квартили x0.25, x0.5, x0.75,которые делят совокупность на четыре равные части, децили x0.1, . . . , x0.9, процентили x0.01, . . . , x0.99.

Для совокупностей с симметричным распределением и нулевым средним(соответственно,с нулевой модой и медианой)используют понятие двустороннего квантиля xöF :

P (−xöF ! x ! xöF ) = F (öxF ) − F (−xöF ) =

-F f (x) dx = F .

 

−xöF

2.4.Моменты и другие характеристики распределения

Моментом q-го порядка относительно

c признака x называют величину

(q и c Ñвеличины детерминированные)

 

 

m (q, c) =

1 N

(xi − c)q ,

N

 

=1

 

 

 

!i

 

2.4.Моменты и другие характеристики распределения

71

в случае,если она рассчитываетс я непосредственно по выборке;

 

k

 

k

 

 

!l

αl (øxl − c)q =

!

 

m (q, c) =

 

fl (øxl − c)q

l ,

 

=1

 

l=1

 

если используются данные эмпирического распределения частот;

+-

µ (q, c) = f (x) (x − c)q dx = E((x − c)q )

−∞

Ñдля теоретического распределения вероятности(cм.ПриложениеA.3.1).

В эконометрии для обозначения теоретических илиÇистинныхÈзначений величины(в генеральной совокупности)часто используются буквы греческого алфавита,а для обозначения их эмпирических значений(полученных по выборке)или их оценокÑсоответствующие буквы латинского алфавита.Поэтому здесь в первых двух случаях момент обозначается через m,а в третьем случаеÑчерез µ. В качестве общей формулы эмпирического момента(объединяющей первые два случая)будет использоваться следующая:

m (q, c) = !N αi (xi − c)q .

i=1

В принципе,моменты могут рассчитываться относительно любых c,однако встатистикенаиболееупотребительнымоменты,рассчитанныепри c,равномнулю или среднему.В первом случае моменты называют начальными,во второмÑ центральными.В расчете центральных моментов используются величины xi − xø, которые часто называютцентрированными наблюдениями и обозначают через xöi .

Средняя является начальным моментом1-го порядка:

xø = m (1, 0),

E (x) = µ (1, 0).

Благодаря этому обстоятельству центральные моменты при целых q всегда можно выразить через начальные моменты.Для этого надо раскрыть скобки(возвести в степень q)в выражении центрального момента.

Центральный момент 2-го порядка или 2-й центральный момент называется дисперсией и обозначается через s2 (эмпирическая дисперсия)или σ2 (теоретическая дисперсия):

s2 = m (2, xø) ,

σ2 = µ (2, E (x)) .

Соседние файлы в папке Диплом