Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Churakov_Mat_met_obr_exp_dan_v_ekon

.pdf
Скачиваний:
29
Добавлен:
26.03.2016
Размер:
5.46 Mб
Скачать

мать так: при достаточно больших / рассчитанная по правилу (3.82) величина Si будет меньше соответствующей величины/ на P^i/a, т.е. расчетные значения «запаздывают» относительно ис­ тинных. Аналогичный анализ можно провести и при трендах с более сложной моделью, выявив соответствующие ошибки. На­ личие ошибок говорит о том, что при отличии модели тренда от (3.80) необходимо алгоритм экспоненциального сглаживания (3.82) видоизменить таким образом, чтобы он оказался более приспособленным к новой модели тренда, нежели (3.82). Такие алгоритмы разработаны и, по существу, представляют собой мно­ гократное применение изложенного алгоритма экспоненциаль­ ного сглаживания. Приведем некоторые из них, не прибегая к де­ тальному анализу.

Пусть д = I, т.е. модель тренда представлена выражением (3.88). В этом случае алгоритм экспоненциального сглаживания представлен двумя рекуррентными соотношениями:

Si = Si_^-^a(yi-Si_0,

(3.93)

Qi = Qi-i + OL(Si- a_i), / = 1, 2,..., Л^,

(3.94)

из которых второе представляет собой также алгоритм экспонен­ циального сглаживания, но в предположении, что «входом» для него служат «выходы» первого алгоритма. Для организации вы­ числений теперь нужно иметь два начальных условия. Они зада­ ются в виде:

^0=^00-—йю, Qo='Soo-—aiQ,

(3.95)

где ^00, ^10 — некоторые начальные оценки параметров модели тренда. Их можно найти, например, методом наименьших квад­ ратов на основании небольшого числа начальных элементов об­ рабатываемого временного ряда. После обработки всего ряда оценки параметров тренда находят по формулам:

Долг = 25лг- QN, aijsi = a(Sj^- Ол^)/р, что позволяет прогноз выразить соотношением

(3.96)

= (2 + а(т - N)/^)SN- (1 + a(m - А0/Р)(2лг.

150

Заметим, что вычисления могут быть организованы не обяза­ тельно в терминах экспоненциальных средних (3.93), (3.94), но и в терминах текущих оценок ао/ иац параметров модели ряда а^, а\. Действительно, по аналогии с (3.95) имеем:

Si =aoi - P5i//a, Q/ =% - 2^au/a.

Подставив эти выражения в (3.93), (3.94), получим:

% - ^Sii/a = ау1 + Р(5о(/_1) - ^ащ^х)),

Soi - 2pai//a = а(ао/ - &ац/а) + p(5o(/_i) - 2pai(/_i)/a). Из этой системы находим:

% = ^о(/-1) + ^1(/-1) + (1 - Р y^h ^/ ^Д'/- 5о(/_1) - 5i(/_i),

^1/ = ^1(/-1) + осе/, /= 1, 2,..., Ж

(3.97)

Аналогичные соотношения для тренда, описываемого поли­ номом второго порядка/- = ло + ^i^/ "^ <^2^/V2, приобретают вид:

е/=а-1 + сх(5,-ам),

if, = Л/_1 + а(а - Л/-1), / = 1, 2,..., Л^

при

Р, Р(2-а)^

2р , р(3~2а)

^а

. " . ЗР. Зр(4~3а).

^ = ^ 0 0 ~ — ^ 1 0 +

5 ^20>

«

2а^

текущие оценки:

aon=^3Sn-3Qn + Rn,

dm = а((6 - 5a)Sn - 2(5 ^ 4а)(3„ + (4 - Зa)Л,)/2p^ a2n-=a\Sn-2Q„+R^yf;

151

прогноз

Ущ = SON ^{m-N)axN-^{m-

М)^а2м/2.

Как и в предыдущем случае, этот алгоритм может быть выра­ жен через текущие оценки параметров модели тренда.

3.6. Анализ адекватности модели тренда временного ряда

Правильно обоснованная модель тренда в значительной степени определяет успешность решения задачи прогнозирования вре­ менного ряда. К сожалению, универсальных рекомендаций по выбору модели, гарантирующей последующий успех, нет. Интуи­ тивные догадки, следующие из результатов начального визуаль­ ного обзора рада, умозрительные заключения, основанные на анализе природы ряда и обусловливающих его причинно-следст­ венных явлений, опыт решения прогностических задач, квали­ фикация исследователя — все это способствует удаче, приближа­ ет, но не обеспечивает ее. Поэтому часто оказывается целесооб­ разным задаться несколькими моделями, а в последующем, под­ вергнув их надлежащему дополнительному анализу, отдать пред­ почтение наиболее соответствующей (адекватной) результатам наблюдений. Но для этого необходимо иметь набор критериев, выявляющих данную адекватность. В подборе таких критериев также нет общепризнанного мнения. Остановимся на одном час­ то практикуемом подходе. В его основе лежит исходная гипотеза о том, что случайные составляющие р/, / = 1, 2,..., 7V, в составе ря­ да (3.1) образуют последовательность центрированных независи­ мых нормально распределенных случайных величин. Поэтому если модель тренда выбрана удачно и правильно оценены ее па­ раметры, остаток ряда

я

et =3^1 - S hN^kiU)^ i = h 2, ..., Л^, (3.98)

к=0

должен также образовывать последовательность типа дискретно­ го белого шума. Поэтому адекватной признают модель, которая порождает остаточный ряд (3.98) со случайными центрирован­ ными некоррелированными нормально распределенными

152

элементами. Тогда проверка адекватности сводится к выявлению перечисленных свойств остаточного ряда. Это осуществляется так.

Проверка случайности элементов остаточного ряда проводит­ ся по критерию серий или критерию поворотных точек. При вом из них по результатам сравнения двух соседних элементов ос­ таточного ряда составляется последовательность нулей и единиц. Если первая разность Ав/ = e/+i — е/ > О, то в последовательности ставится нуль, иначе — единица. Далее подсчитывается число се­ рий v(AO, представляющих собой фрагменты последовательнос­ ти, состоящие только из нулей или единиц, и продолжительность ^тах самой ДЛИННОЙ ссрии. Остаточный ряд с вероятностью 0,95 считается случайным, если

^тах<^0(А^); v(^)>[(2iV-l)/3-2V(167V-29)/90].

Здесь/:о(ЛО = 5 при N< 26 и k{^{N) = 6 при 7V>26; [...] -символ це­ лой части.

При использовании менее строгого критерия поворотных то­ чек поступают так: сравнивают элемент ряда остатков с двумя со­ седними; если он окажется меньше или больше их, то соответст­ вующая точка признается поворотной; далее подсчитывается число S всех поворотных точек; если окажется

s>[2(N-2)/3-2^j(l6N-29)/90],

остаточный ряд считается состоящим из случайных элементов. Проверка центрированности проводится с использованием

t'Kpumepun Стьюдента. С этой целью формируется статистика

YH/WJVA^/O,,

(3.99)

ще

т.е. среднее значение и среднеквадратичное отклонение остаточ­ ного ряда. Далее задаются уровнем значимости а или доверитель­ ной вероятностью 1 -- а и находят lOOa/2-процентную точку wiooa/2 ^распределения с N— 1 степенями свободы. Если окажет­ ся у > wiooa/25 то гипотеза о центрированности остаточнохо ряда

153

отвергается как не соответствующая экспериментальным дан­ ным с вероятностью ошибиться а. При противоположном нера­ венстве ряд признается центрированным с вероятностью 1 — а правильности этого решения.

Проверка независимости уровней остаточного ряда преследует цель подтвердить отсутствие систематической составляющей в составе ряда и проводится с применением критерия Дарви­ на—Уотсона, В соответствии с этим критерием вычисляется вели­ чина

 

 

л^

 

 

N

 

^

 

 

 

 

 

S (ек^-е^-О

 

 

 

 

 

 

 

к=2

 

= 3 1 k=2

= 2(l-i?),

 

 

 

 

k=l

 

 

 

k^l

J

 

 

 

 

 

 

 

 

 

 

 

 

где R — так называемый коэффициент автокорреляции первого по-

радка.

 

 

 

 

 

 

 

Таблица 3.1

 

 

Нижний di и верхний di пороги

 

 

 

 

 

Объем

 

 

 

Сложность модели тренда q

 

 

выборки Л^

 

1

 

2

 

3

 

4

 

5

 

 

 

 

 

 

 

di

di

di

di

di

d2

dx

di

dx

di

15

1,08

1,36

0,95

1,54

0,82

1,75

0,69

1,97

0,56

2,21

20

1,20

1,41

1,10

1,54

1,00

1,68

1,90

1,83

0,79

1,99

30

1,35

1,49

1,28

1,57

1,21

1,65

1,14

1,74

1,07

1,83

50

1,50

1,59

1,46

1,63

1,42

1,67

1,38

1,72

1,34

1,47

100

1,65

1,69

1,63

1,72

1,61

1,71

1,59

1,76

1,57

1,78

Величина ^следующим образом подвергается анализу. Преж­

де всего если окажетсяrf> 2, то заменяют dnad

=4 — f/и после­

дующая работа ведется с ^

по тому же алгоритму, что ncd.B

рас­

смотрение вводятся два порога: нижний di и верхний ^2- Значе­ ния этих порогов определяются объемом выборки N, сложностью

154

модели тренда q, уровнем значимости а и при а = 0,05 система­ тизированы в табл. 3.1 [27].

Если d (или d )G(0, d\), то это является признаком сильной автокоррелированности элементов остаточного ряда, и предпо­ лагаемая модель тренда признается неадекватной. Если d{d )G {dj, 2), то элементы остаточного ряда классифицируются как незави­ симые, а модель тренда - адекватной. При d{d*)^{d\, di) одно­ значный вывод не делается и применяют дополнительные мето­ ды исследования.

Дополнительный анализ проводят с использованием корреля­ ционной функции tim) остаточного ряда, которую определяют сле­ дующим образом:

N-m

г{т) =

A:=l

Значение этой функции R = r{\), называемое коэффициентом автокорреляции, уже встречалось при формировании критерия Дарбина-Уотсона, и оно же используется для анализа независи­ мости. Величина R сравнивается с порогом у, зависящим от объ­ ема выборки и доверительной вероятности. При уровне значимо­ сти 0,05 (доверительной вероятности 0,95) значения порога со­ держатся в табл. 3.2 [11].

 

Зависимость порога от объема выборки

Таблица 3.2

 

 

Объем N

10

15

20

25

30

Порог у

0,360

0,328

0,300

0,276

0,257

Если окажется /? > у, то принимается решение о существен­ ной корреляции элементов остаточного ряда и, следовательно, о неадекватности модели тренда.

Иногда оказывается целесообразным применение более ком­ плексного критерия, основанного на корреляционной функции г{т). Рассчитывается коэффициент

155

где J< N/3. Доказывается, что статистика G подчинена х^-распре- делению с (N — J — I) степенями свободы. Тогда если окажется G < iviooa» где iviooa ^сть ЮОа-процентная точка х^-распределения с (А^— / ~ 1) степенями свободы, то с вероятностью 1 — а элемен­ ты остаточного ряда признаются некоррелированными, а если они гауссовские, то и независимыми.

Проверка на нормальное распределение остаточного ряда мо­ жет проводиться многочисленными методами, разработанными в математической статистике. Остановимся на двух из них, пола­ гая, что предыдущие тесты по анализу случайности, центриро­ ванности и независимости дали положительные результаты.

Распространенным методом проверки гипотезы о нормаль­ ном распределении является'ji^-KpumepuuПирсона. В кратком из­ ложении его существо заключается в следующем.

Пусть ^min и ^тах соотвстственно наименьший и наибольший элементы ряда остатков. Отрезок [е^^^, ^тюА разбивают на s рав­ ных непересекающихся интервалов так, чтобы в каждый из них попало не менее пяти элементов ряда. Иногда рекомендуют S = 1пЛ71п2. Символами hwNj{j= 1,2,..., s) обозначены соответ­ ственно длина интервала и число элементов остаточного ряда, попавших в У-й интервал. Границы у-го интервала обозначены

символамиХу, Xj+\,Xj = (xj + Xj+ \)/2 - центр интервала. Далее под­ считывают теоретические вероятности Pj попадания случайной величины нау-й интервал:

Pj =h 1

exp'

2al

д/2яа^

 

строят статистику Пирсона

 

 

 

 

'P/P_

Затем задаются уровнем значимости а и находят ЮОа-про- центную точку vviooa х^-квадрат распределения с ^ - 3 степенями свободы. Если окажется у < wiooa» то с вероятностью 1 — а нет ос­ нований отвергать гипотезу о нормальном распределении эле-

156

ментов остаточного ряда; при противоположном неравенстве ги­ потеза отвергается с вероятностью а совершить ошибку.

Более простым, хотя и менее обоснованным, является метод асимметрии и эксцесса. Его сущность такова [21].

По экспериментальным данным (остаточному ряду) строятся эмпирические коэффициенты асимметрии Аа и эксцесса Аэ*

л^

N

^ а = -

Кэ='

N

 

^ А : = 1

^ к=\

Если эти коэффициенты близки к нулю, то появляются осно­ вания считать остаточный ряд гауссовским. Для усиления этих оснований вычисляются среднеквадратические отклонения коэффициентов [И, 21]:

ая =

6(N-l)

(7V+1)(JV + 3)'

24Л^(7У-2)(А^-3)

1(7^-1)^(ЛГ+3)(Л^+5)*

Если |Аа| < 1,5аа, |Аэ1 - 1 »5аэ, то считают, что распределение ос­ таточного ряда не противоречит гипотезе о нормальном распре­ делении. Если хотя бы один из коэффициентов оказывается больше двух среднеквадратических отклонений, гипотеза о нор­ мальности отвергается.

Важной характеристикой модели является ее точность. Су­ ществуют различные определения этого понятия. Достаточно распространенной и простой мерой точности является относи­ тельная ошибка

1 ^1^-1

'^отн =^Sp|ioo;

Если окажется ЕОТН ^ 15%, то точность признается достаточ­ ной.

Глава 4

СТОХАСТИЧЕСКИЕ ВРЕМЕННЫЕ РЯДЫ

4.1. Случайные процессы (начальные определения и классификация)

Теория стохастических временных рядов базируется на соответ­ ствующей теории случайных (стохастических) процессов. Приве­ дем некоторые исходные положения, полагая, что читатель зна­ ком с терминологией теории вероятностей и элементами вероят­ ностных операций.

Пусть проводится случайный эксперимент и (Q, F, Р) — соот­ ветствующее ему вероятностное пространство, COGQ - элемен­ тарное событие.

Определение 4.1. Вещественная функция ^ = ф((о) элементар­ ного события со называется случайной величиной, если для VxG (—оо, оо) множество тех со, для которых ф(со) < х, принадлежит множеству JF, т.е. {со: ф(со) < x}c F, и Р(ф(со)е (-оо, оо)) = 1.

Так как для каждого события из /^определена вероятность Р, то условие {со: ф(со) < х}с /"означает, что при любом х может быть определена вероятность события ф(со) < х. Случайная величина, таким образом, представляет собой величину, значение которой до проведения эксперимента точно предсказать нельзя, однако можно указать вероятность того, что в эксперименте случайная величина JSfокажется меньше любого числа х.

Определение 4.2. Вещественная функция ДО = ф(со, О, где /е Т и имеет смысл времени, называется случайным, или стохастичес­ ким, процессом, если при каждом фиксированном / = Г величина Х(/*) = ф(о), /) является случайной величиной.

Множество Г задает область определения процесса. Сам слу­ чайный процесс, что следует из его определения, можно рассма­ тривать как параметрически заданную на множестве ^случайную величину. Значение случайного процесса при фиксированном аргументе / принято называть сечением процесса. Если в экспери­ менте элементарное событие со примет определенное значение со = co*G Fy то функция ф(со , i) оказывается детерминированной

158

функцией времени и называется реализацией (траекторией) про­ цесса. Таким образом, случайный процесс как функцию двух пе­ ременных / и со можно рассматривать или как семейство завися­ щих от параметра / случайных величин, или как семейство реали­ заций (содержащее, вообще говоря, бесконечное их число).

Если множество значений случайного процесса и область его определения непрерывны, то процесс принято называть непрерывнозначным. Если, кроме того, в отдельных реализациях отсут­ ствуют разрывы, случайный процесс называют непрерывным.

Случайный процесс называют дискретным (разрывным, дис­ кретным процессом с непрерывным временем), если множество

x(t)

x(t)

x{t)

x{t)

ч

в

Рис. 4.1. Реализации случайного процесса:

а— непрерывный процесс, б — дискретный процесс,

в— случайная последовательность,

г— дискретная случайная последовательность

159

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]