Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

где со среднее квадратическое отклонение для наблюдаемого ря­ да уг с п элементами и р параметрами полинома:

'L iv i- y ù 2 i=l_______

 

°1

 

 

п — р — \

 

 

 

 

 

 

Во втором случае получаем систему уравнений

 

S ['\y) = S0 -

1 -

a -

,

0

—«)(2 —ot)^

 

^

Г

° 1 +

------2ÔÜ------ û2>

 

St[21(î/)=So -

2 (1 - a ) *

, ( l - a ) ( 3 - 2 a ) ^

 

-

V

 

û l + -------2a?-------û2’

S[3](y) = a0 -

3(1 -

a) Л

,

3 ( l - a ) ( 4 - 3 a ) ^

~

 

a i +

2a?

û2)

откуда имеем

 

 

 

 

 

 

 

S0 =3 (5 [1](у)- 5 р](у)) +S [ 3\ y ) ,

 

 

 

S, = ^ ^ ( ( 6 - 5a) S \ %

)

-

2(5 -

4a)5t[2](y) +(4 - 3a ) S \ % ) ) ,

Й2 = ( Г = ^ № ](у) ■ 25‘21(y)+5‘31(2/)) '

Ошибка прогноза рассчитывается по формуле

o ( y t + i ) « аол/2а 4- За2 + За3/3.

Для применения этих формул необходимо знать начальную ве­ личину в рекуррентной формуле S ^ ^ y ) . Обычно она определяет­ ся из анализа только части динамического ряда. При отсутствии предварительных рекомендаций для нахождения начальных усло­ вий можно пользоваться следующими формулами:

s [ - i( y ) = °о -

ÛI.

17*

для линейной модели,

 

 

 

 

 

5 Й (у ) = оо -

1-ot

 

, (l-ot)(2-cx)

 

- ^ Г ° 1+

2o?

° 2’

5 & (у ) = а о -

2(1 - a )

,

( l - a ) ( 3 - 2 c t ) _

^ Г

° 1 +

2а?

° 2’

S f \ ( y ) = a 0 -

3(1 -

a)

„ ,

3 ( l - a ) ( 4 - 3 « ) _

" ^

^

a , +

2o?

° 2

для квадратичной модели.

Значения параметров для этих формул рекомендуется получать методом наименьших квадратов. Выбор начальных условий влияет на оценки погрешностей метода. Другой важной проблемой явля­ ется выбор параметра сглаживания а. При значениях а, близких к единице, учитываются только последние члены ряда, при а, близ­ ких к нулю, — практически все члены ряда. Точных рекомендаций по выбору значений a не существует.

Метод экспоненциального сглаживания разработан для рядов, состоящих из большого числа наблюдений, при увеличении числа наблюдений точность прогноза должна возрастать. При анализе ко­ ротких рядов метод не «срабатывает», так как часто не «успевает» учесть изменения при быстрых темпах роста процесса. Если яв­ ление протекает в одних и тех же условиях, то точность прогноза определяется величиной периода предыстории явления (базисного периода) и длительностью прогнозируемого периода. Количествен­ но точность прогноза можно оценить по имеющемуся динамиче­ скому ряду.

§ 10.5. Многофакторное прогнозирование

Рассмотрим динамическое многофакторное прогнозирование. Многофакторные динамические модели должны учитывать про­ странственные и временные изменения факторов (аргументов), а также (при необходимости) запаздывание влияния этих факторов на зависимую переменную (функцию). Многофакторное прогнози­ рование позволяет учитывать развитие взаимосвязанных процессов и явлений. Основой его является системный подход к изучению исследуемого явления, а также процесс осмысления явления как в прошлом, так и в будущем. В многофакторном прогнозировании

одной из основных проблем является проблема выбора факто­ ров, обусловливающих поведение системы, которая не может быть решена чисто статистическим путем, а только при помощи де­ тального изучения существа явления. Здесь следует подчеркнуть преимущество анализа (осмысления) перед использованием чисто статистических (математических) методов изучения явления.

В традиционных методах (например, в методе наименьших квадратов) считается, что наблюдения независимы друг от друга (по одному и тому же аргументу). В действительности существует автокорреляция и, если ее не учитывать, это приводит к неоптимальности статистических оценок, затрудняет построение довери­ тельных интервалов для коэффициентов регрессии, а также провер­ ку их значимости.

Автокорреляция определяется по отклонениям от трендов. Она может иметь место, если не учтено влияние существенного фактора или нескольких менее существенных факторов, действия которых направлены «в одну сторону», либо если неверно выбрана модель, устанавливающая связь между факторами (аргументами) и функ­ цией. Для выявления наличия автокорреляции применяется крите­ рий Дурбина—Уотсона

i= l

где zi случайные отклонения от регрессионной модели.

Для исключения или уменьшения автокорреляции применяется переход к случайной компоненте (исключение тренда) или введение времени в уравнение множественной регрессии в качестве аргу­ мента.

В многофакторных моделях возникает проблема мультиколли­ неарности — наличие сильной корреляции между факторами, кото­ рая может существовать вне всякой зависимости между функцией и факторами.

При мультиколлинеарности между аргументами существует (ли­ нейная) связь и наряду с уравнением регрессии имеются и другие (линейные) отношения, искажается физический смысл коэффици­ ентов регрессии, появляется некорректность — слабая обусловлен­

ность систем алгебраических уравнений. Соответствующие диаго­ нальные элементы матрицы, обратной матрице вторых производ­ ных от функции правдоподобия, определяющие дисперсии оценок коэффициентов регрессии, стремятся к бесконечности и порож­ дают ошибочную (в данном случае) тенденцию к исключению существенных переменных из уравнения регрессии. Мультикол­ линеарность определяется как степень отклонения независимых переменных (факторов) от ортогональных переменных. Для про­ верки наличия мультиколлинеарности во множестве независимых переменных используется показатель

х2 = _ ( п _ ! _ 1 (2 р + 5)) 1 п ( М ) ,

где X — матрица факторов (аргументов), р число факторов, п — число наблюдений. Показатель у2 приближенно имеет х2-распреде- ление.

Главное в процедуре прогнозирования состоит в последующем выявлении тех факторов, которые наиболее сильно взаимозависи­ мы. Это можно сделать по диагональным элементам матрицы, об­ ратной матрице вторых производных от функции правдоподобия.

Вводится величина

где Cii — i-й диагональный элемент матрицы. Величина Ф* имеет F -распределение с т г - р и р - 1 степенями свободы.

Выявив, какие факторы являются мультиколлинеарными, мож­ но определить характер взаимозависимости между мультиколли­ неарными элементами множества независимых переменных. Для этой цели используются недиагональные элементы обратной матри­ цы и полученные в них коэффициенты частной корреляции между мультиколлинеарными переменными и всеми остальными перемен­ ными. Анализ проводится по t -критерию Стьюдента для коэффици­ ента частной корреляции.

В многофакторном прогнозировании без методов конфлюэнтно­ го анализа (без учета погрешностей аргументов) нельзя обойтись в принципе. Так, в многофакторном анализе необходимо наряду

с оценкой параметров сглаживающей (исследуемой) функции по­ строить прогноз каждого фактора (по неким другим функциям или моделям). Естественно, что значения факторов, полученные в экс­ перименте в базисном периоде, не совпадают с аналогичными зна­ чениями, найденными по прогнозирующим моделям для факторов. Поэтому либо это различие должно быть объяснено случайными от­ клонениями, величина которых выявлена указанными различиями и должна быть учтена сразу же при оценке параметров сглажива­ ющей функции, либо это различие не случайно и никакого прогно­ за делать нельзя, т. е. в задаче многофакторного прогнозирования исходные значения факторов, как и значения сглаживающей функ­ ции, должны быть взяты с соответствующими ошибками, закон распределения которых должен быть определен при соответству­ ющем анализе, предшествующем процедуре прогнозирования.

Пример (построение многофакторного прогноза). Рассмотрим задачу построения прогноза значений показателя а использования производственной мощности отрасли связи в 1986-1990 гг. как функцию факторов da, и, <!&• В качестве базового периода бьш

взят период 1977-1985 гг. (табл. 10.1).

Таблица 10.1

Исходные данные для определения зависимости а от dg, u,

тыс. разг.

da

и

da6

5 канал

6,72

0,112

5,4

0,431

6 ,9 7

0,148

4,8

0 ,4 8 4

7,17

0 ,1 9 0

6,3

0,552

7,37

0 ,2 3 4

6,8

0,593

7,73

0,273

7,2

0 ,6 3 0

7 ,9 9

0,312

7,6

0,649

8,16

0,347

8,1

0,663

8 ,5 0

0,361

8,5

0,687

8,23

0,423

8,9

0 ,7 2 4

Погрешность исходных данных принималась равной 5 едини­ цам первого не указанного разряда после запятой.

Первоначально для каждого фактора необходимо было выбрать модель, по которой определяют «истинные» значения факторов в базовом периоде (табл. 10.2) и которую используют в дальнейшем

для построения прогноза. Отбор наиболее приемлемых моделей

проводился по х2-критерию Пирсона.

Таблица 10.2

«Истинные» значения факторов

Пара-

 

 

 

 

 

Годы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

метр

1977

1978

1979

 

1980

1981

 

1982

 

1983

 

1984

1985

С?а

0,1121

0 ,1 4 7 9

0 ,1 9 0 3

0 ,2 3 4 6

0 ,2 7 3 0

0 ,3 1 0 3

0 ,3 4 6

4

0 ,3 6 1 0

0 ,4 2 4 8

и

5,3811

5 ,8 1 2 0

6 ,2 6 2 2

6 ,7 5 9 2

7 ,2 0 0

 

7 ,6 4 5 6

8 ,1 3 9 6

8 ,5 0 1 7

8 ,8 4 6 6

С?аб

0 ,4 5 3 7

0 ,5 0 2 8

0 ,5 4 6

0

0 ,5 8 4 0

0 ,6 1 7

5

0 ,6 4 7

0

0 ,6 7 3

0

0 ,6 9 5 9

0 ,7 1 6 1

 

 

 

 

 

Таблица 10.3

 

Прогнозируемые значения 3 и а(а)

 

Параметр

 

 

Годы

 

 

1986

1987

1988

1989

1990

 

тыс. разг.

С:

10,64

11,01

11,22

п ,б б

12,31

9

канал

 

 

 

 

 

о (3 )

0 ,2 9

0,31

0 ,3 2

0,33

0 ,3 4

В процессе анализа для прогноза показателя а была выбрана

функция

 

 

 

"b СЦ(1й“Ь Û5— .

 

 

(X=

О] + Й2^аб "I"

 

 

 

 

 

 

U

 

Оценки параметров вектора а и их дисперсий получены по ал­ горитмам, описанным в §7.12, и были следующими: Si =0,067, 02 = 0,515, З3 = 1,411, а 4 = —11,719, 05 = 7,513, D(2i) = 0,010, D(Ô2) = 0,018, D(S3) = 0,0003, D(â4) = 0,085, D(a5) = 0,008.

Значения â в базовом периоде при найденных оценках векто­ ра а не отличались от заданных значений а больше, чем на 0,9 %; величина у2 была равна 0,0034; вероятность того, что модель не мо­ жет быть отвергнута, была равна 0,999. Прогнозируемые значения 2 и их средние квадратические отклонения за период 1986-1990 гг. приведены в табл. 10.3.

§ 10.6. Идентификация моделей типа АРПСС

Приступим к процедуре идентификации модели, записанную в конечных разностях. Рассмотрим общую разностную модель — модель АРПСС. Конкретная цель состоит в том, чтобы получить

некоторое указание на то, какие значения р, d и q нужны в общей линейной модели АРПСС, и выбрать некоторые начальные значе­ ния параметров этой модели. Полученная таким образом пробная модель является отправной точкой для применения более формаль­ ных и эффективных методов оценивания, описанных в гл. 7.

Идентификация и оценивание взаимосвязаны. Идентификация неизбежно не точна. Она неточна потому, что возникновение вопроса о том, какие типы моделей встречаются на практике и в ка­ ких обстоятельствах, — это следствие поведения объектов физи­ ческого мира, и проблема идентификации не может быть решена только математическими методами. Поскольку на этапе идентифи­ кации нельзя точно сформулировать задачу, приходится исполь­ зовать статистически «неэффективные» методы. На этом этапе особенно полезны графические методы. Предварительная иденти­ фикация не требует ничего, кроме анализа класса моделей, которые будут позднее эффективно подгоняться к результатам наблюдений и проверяться.

Например, идентифицировать подходящий класс моделей из об­ щего семейства моделей АРПСС

$ (B )A dyt = е0 + 0(Я)а4,

который применен для описания данного ряда, можно следующим образом:

а) вычислим конечную разность от yt столько раз, сколько необ­ ходимо, чтобы обеспечить стационарность модели, и сведем изуча­ емый процесс к смешанному процессу авторегрессии—скользящего среднего

Ф ( B ) ( ù t = 0о H- 0 ( B ) Û £

где o)t = (1 - B )dyt = A dyt;

б) идентифицируем конечный ряд с помощью автокорреляци­ онной и частной автокорреляционной функций; эти функции ис­ пользуют также для нахождения приближенных оценок параметров, чтобы получить начальные значения параметров для этапа оцени­ вания итеративных процедур.

В процессе идентификации прежде всего надо оценить порядок разности d.

Автокорреляционная функция стационарного смешанного про­ цесса авторегрессии—скользящего среднего удовлетворяет разност­

ному уравнению

$(В)рк = 0, k > q ,

где pfc — автокорреляция (автокорреляционная функция) с задерж­

кой к,

которая для вариационного ряда z\,гг, ..., zn определяется

по формуле

 

 

 

M[(zt - [i)(zt+k - И)]

_

M[(zt - nXzt+fc - p)] ^ Гк

к

V м t(2t “ H)2]M [(2t+fc - (i)2]

 

Yo

Функция у*; от задержки к называется автоковариационной

функцией стохастического процесса',

функция рк от задержки к

называется автокорреляционной функцией стохастического про­ цесса. На практике определяют только выборочные оценки этих функций. Например, оценку у к определяют по формуле

j п—к

Yк = — У. (zt- z)(zt+k -z), к= 0, 1, ...,т,

п

t = 1

где 2 среднее значение ряда наблюдений, п число наблюдений. Дисперсия оценки выборочного коэффициента автокорреляции

имеет вид

1

+0°

°(?А:)% -

2 (Pv + Pv+fcPv-fc - 4pfcpvpv_fc + 2plpl).

 

v=—оо

Если pit = С ^ , —1 < С < 1, т. е. функция pfc затухает экспонен­ циально, то дисперсия оценки pfc определяется по формуле

Автокорреляционная функция стационарного смешанного про­ цесса авторегрессии — скользящего среднего удовлетворяет разност­

ному уравнению Ф(В)рк = 0.

 

 

Кроме того, если Ф(В )= f ] ( l

—GiB), то решение этого раз-

2=1

 

в предположении

ностного уравнения для к-й автокорреляции

отсутствия кратности корней имеет вид

 

рк = A\G\ + A 2G2 +

+ ApGp,

к> q —р.

Условие стационарности требует, чтобы нули Ф(В) лежали вне единичного круга, и приводит к тому, что корни G\, Gi, ..., Gp ле­ жат внутри единичного круга. Для стационарной модели, ни один из корней которой не лежит близко к границе единичного круга, автокорреляционная функция быстро затухает при средних и боль­ ших к. Если хотя бы один действительный корень, например G\, приближается к 1, так что G\ = 1 —8, где 8 —малое положительное число, то, поскольку pjfc as Ai(l —kb) для больших к, автокорре­ ляционная функция не будет быстро затухать, а будет убывать медленно и почти линейно. Следовательно, отсутствие тенден­ ции к затуханию автокорреляционной функции может рассмат­ риваться как свидетельство того, что существует корень, близкий к 1. Выборочная автокорреляционная функция похожа на теоре­ тическую. Отсюда следует, что отсутствие затухания выборочной автокорреляционной функции логично истолковать в том смыс­ ле, что процесс yt является нестационарным, хотя, возможно, его разность Д yt или какая-либо разность более высокого порядка стационарна. Предполагается, что необходимая для получения ста­ ционарности степень разности d достигнута, если автокорреля­ ционная функция ряда со; = A dyt быстро затухает. На практике d обычно равно 0, 1 или 2. Для определения d достаточно просмот­ реть примерно 20 первых значений автокорреляции исходного ряда и рядов его первых и вторых разностей. Приняв предваритель­ но, что разность имеет степень d, по общему виду выборочных автокорреляционной и частной автокорреляционной функций со­ ответствующего разностного ряда получаем указания к выбору порядков р и q операторов авторегрессии и скользящего средне­ го, т. е. проводим идентификацию результирующего стационарного процесса АРСС.

В то время как автокорреляционная функция процесса авторе­ грессии порядка р убывает плавно, ее частная автокорреляционная функция имеет обрыв после р-й задержки. Однако автокорреляци­ онная функция процесса скользящего среднего порядка q обрыва­ ется после задержки q, в то время как ее частная автокорреляция плавно убывает с ростом задержки.

Автокорреляционная функция смешанного процесса, содержа­ щая компоненту авторегрессии порядка р и компоненту скользя­

щего среднего порядка q, после первых q — p задержек представляется в виде суммы экспонент и затухающих синусоид. В то же время частная автокорреляционная функция смешанного процесса приближенно представляется суммой экспонент и затухающих си­ нусоид после р q задержек.

Выборочные автокорреляции могут иметь большие значения дисперсии и быть сильно коррелированы друг с другом, и нель­ зя ожидать детального сходства выборочной автокорреляционной функции с теоретической. Выборочные функции могут иметь всплески и тренды, которые теоретические функции не имеют. Поэтому может понадобиться исследование на этапах оценивания и диагностической проверки двух или более возможных моделей процесса. Важно знать, какие отличия выборочной автокорреляци­ онной функции допустимы. В частности, необходимо уметь оце­ нить, становятся ли автокорреляции и частные автокорреляции практически нулевыми при задержках, больших некоторого к. Для больших задержек можно вычислить стандартные ошибки оцени­ ваемых автокорреляций по формуле

о[р*] % ^ / 2 t 1 + 2(Pi + р2 + • • • + Р,)]1/2, к > q,

в которой pk выборочная оценка к-й автокорреляции. Стандартная ошибка частной автокорреляции порядка не меньше р + 1 вычисля­ ется по формуле

<*[$fcfc] *

к > р ,

где Фкк — последний коэффициент процесса авторегрессии порядка р. Даже для не слишком больших п выборочный коэффициент автокорреляции распределен примерно по нормальному закону со средним значением, равным нулю. При гипотезе, что автокорреля­ ция равна нулю, ее оценка р&, деленная на стандартную ошибку, будет распределена примерно по нормальному закону с единич­ ной дисперсией. То же справедливо и для частных автокорреляций. Эти факты можно использовать для получения нестрогих правил проверки, являются ли теоретические автокорреляции и частные автокорреляции при задержках, больших некоторой, практически

нулевыми.

Соседние файлы в папке книги