Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
7
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

модель авторегрессии можем записать в виде

Vt = ^ B )a f,

здесь ÿt выражается как бесконечная взвешенная сумма импуль­ сов at, at- ь • • • Процессы авторегрессии могут быть стационарными или нестационарными. Чтобы процесс был стационарным, необ­

ходимо чтобы

коэффициенты ф ь ф г , ... оператора ф(В) = Ф_1(В)

образовывали сходящийся ряд.

2. М о д е л ь

с к о л ь з я щ е г о ср е д н е го . Пусть yt линейно за­

висит от конечного числа q предыдущих значений at_,- Процесс

Ht =

GjOj—i 02^4—2

Qq&t—q

называется процессом

скользящего среднего порядка q; В{, г =

= 1,2, ... , q, оцениваемые параметры.

 

Введем оператор скользящего среднего порядка q, который име­

ет вид

 

 

B ( B ) = l - Q lB - Q 2B 2 -

- B qB q.

Тогда щ = B(B)at- Модель содержит q + 2 неизвестных парамет­ ров (i, 01, 02, ...,0g, о2(а), подлежащих оценке по наблюдениям. Последовательность независимых случайных величин at, a « - i , ...

(белый шум) вводится для генерации динамических рядов, в ко­ торых последовательные значения сильно зависимы. Например, бе­ лый шум at можно трансформировать в процесс yt при помощи линейного фильтра ф(В):

yt = yL+ at + фгае_1 + ф г ^ - г + = Ц + Ф(B)at.

3. С м е ш а н н ы е м о д е л и а в т о р е г р е с с и и — с к о л ь з я щ е ­ го с р е д н е г о . Для достижения большей гибкости процедуры подгонки модели к наблюдениям вводят комбинированную модель авторегрессии—скользящего среднего, имеющую вид

yt = $ iÿ t-i + + % y t-p + at -Q \a t-\ - - B qat- q,

ИЛИ

ф (£ )й = B(B)at,

в которой содержитсяp + q + 2 параметров р, Ф[,..., Фр, 0i, — , 09, о2(о), подлежащих оценке по наблюдениям.

4. Н е с т а ц и о н а р н ы е м о д е л и . Для многих рядов наблюде­ ний уровни, относительно которых происходят флуктуации, явля­ ются различными для разных элементов ряда, однако при этом по­ ведения их оказываются схожими. Так, для однородного нестацио­ нарного процесса можно ввести ряд, составленный из разностей A d порядка d, который может быть стационарным. Для описания одно­ родного нестационарного процесса вводят обобщенный оператор

авторегрессии

(Р(В) = Ф (В )(1 - 5 )‘£,

где Ф(В) — стационарный оператор.

Обобщенная модель для описания однородного нестационарно­ го процесса имеет вид

Ф(B)yt = Ф(В)(1 - B )dyt = B(B)yt,

ИЛИ

 

ф(B)tot = В(В)уи

щ = A dyt,

т. е.

 

6)^ — Ф1б)£— J “Ь ... “Ь ФрО)£—р “Ь (If

01Q>t— 1 •* * Bqütqt

Этот процесс называется процессом авторегрессии—проинте­ грированного (просуммированного) скользящего среднего (АРПСС)

порядка (р, d, q). Очевидно, что модель АРПСС является общей для всех рассмотренных здесь моделей. На практике адекватное описа­ ние стационарных и ненестационарных процессов происходит при значениях р и q не больше чем два и при d, равных нулю или еди­ нице (максимум — двум).

§ 10.3. Сглаживание рядов с помощью скользящей средней

При представлении совокупности результатов наблюдений в ви­ де рядов фактически используется предположение о том, что на­ блюдаемые величины имеют некоторое распределение, параметры которого и их изменение можно оценить. По этим параметрам (как правило, по среднему значению и дисперсии, хотя иногда исполь­ зуется и более полное описание) можно построить одну из моделей вероятностного представления процесса.

Другим вероятностным представлением является модель в ви­ де частотного распределения с параметрами pj для относительной

частоты наблюдений, попадающих в j -й интервал. При этом если в течение принятого времени упреждения не ожидается изменение распределения, то решение принимается на основании имеющегося эмпирического частотного распределения.

Важнейшей задачей анализа является выявление основной тен­ денции поведения системы как результат влияния комплекса при­ чин, действующих на изучаемый процесс. Основная тенденция по­ ведения ряда характеризуется трендом. Для выявления основной тенденции поведения ряда применяют процесс сглаживания рядов динамики. Процесс сглаживания требует тщательного анализа, что­ бы исключить возможность «сгладить» под видом случайных вы­ бросов и отклонений существенные кратковременные изменения показателей, отражающих важные моменты в поведении системы.

Для сглаживания рядов динамики часто применяется метод наи­ меньших квадратов. Заметим, что процесс сглаживания рядов ди­ намики в действительности может быть описан гладкой кривой, а наблюдаемые выбросы есть результат наложения случайных по­ мех. В этом случае процедура проведения сглаживания методом наименьших квадратов имеет четкое статистическое объяснение. Однако в других случаях отклонение сглаженной кривой от экс­ периментальной нельзя объяснить только влиянием случайных по­ мех. В подобных случаях применяют метод наименьших квадратов, но здесь он определяет некоторую гладкую кривую, наилучшим об­ разом (в выбранной метрике) проходящую по исходным данным. Ничего общего эта процедура со статистическим толкованием ме­ тода наименьших квадратов в данном случае не имеет.

В результате предварительного анализа (из физических условий задачи) выбирается класс функций, которыми может быть описа­ но изучаемое явление. Параметры этих функций подлежат опре­ делению. В ряде случаев параметры функций могут иметь опре­ деленный физический или экономический смысл. Для процедуры прогнозирования при выборе сглаживающей функции необходимо иметь в виду следующее: функция должна отражать основную за­ кономерность развития явления, в отношении которой можно вы­ двинуть гипотезу, что эта закономерность сохранится и в будущем. Например, для процесса интерполяции достаточно, чтобы выбран­ ная функция наиболее точно описывала значения ряда.

Для сглаживания рядов динамики нецелесообразно брать функ­ ции с большим числом параметров, в то же время выбранная функ­ ция должна быть адекватна исследуемому процессу. Следует иметь в виду, что короткие ряды в редких случаях дают возможность получить объективную информацию. Если рассматривать достаточ­ но длинный ряд, то за это время может измениться поведение си­ стемы.

После определения параметров выбранных функций необходи­ мо отобрать из них наиболее приемлемую. Знание оценок свобод­ ных параметров функций и их дисперсий дает возможность приме­ нять критерии согласия для выбора основной функции. В крайнем случае этот выбор можно провести по величине среднего квадра­ тического отклонения значений элементов ряда и тех же значений, вычисленных по аппроксимирующей функции.

Как было уже отмечено, метод наименьших квадратов при­ меним при детерминированных значениях аргументов (факторов) выбранных функций. Иногда условие детерминированности фак­ торов не выполняется и следует использовать описанные в гл. 7 методы конфлюэнтного анализа. Все необходимые для сглажива­ ния рядов динамики формулы приведены в гл. 7. Отметим еще раз необходимость учета всех погрешностей и неопределенностей исходных данных. В §7.14 показано, например, что для функции т) = —^1^2 + 2^1 регрессионные оценки параметров отличались до 10% от истинных значений, а конфлюэнтные —до 2%. При этом отличие в значениях функции от идеальных в базисном периоде составляет 2-3% . Нетрудно теперь будет указать те значения £, при которых ошибка прогноза по регрессионной модели достиг­ нет 10%, а по конфлюэнтной модели —только 2 %.

Практически во всех применяемых в настоящее время методах прогнозирования коэффициенты моделей сначала определяются пу­ тем подгонки модели к некоторым данным предыстории, а затем проверяются и уточняются по мере поступления новых данных. Выбор коэффициентов, как правило, осуществляется из условия минимизации суммы квадратов остаточных разностей между дан­ ными ут- j и результатами расчета по модели ут- j с учетом различ­ ных весовых множителей o>j, приписываемых остаткам в различные моменты времени. Так, в рамках метода МНК для векторной формы

модели, записанной в общем виде, вектор коэффициентов а выби­ рается на основе минимизации величины

з

где суммирование проводится по всем j вплоть до самого послед­ него наблюдения в момент времени Т. При оценке тех или иных преимуществ различных систем весовых множителей u>j необходи­ мо учитывать не только достигаемую при их использовании точ­ ность прогноза, но и степень сложности соответствующих вычис­ лений.

Скользящее среднее представляет собой оценку по методу наи­ меньших квадратов единственной константы для представления ис­ ходных данных с одинаковыми весовыми множителями. Этому слу­ чаю соответствует простая функция F(t) = 1 для всех t. При этом весовые множители (ùj равны 1 для N последних наблюдений в ин­ тервале 0 ^ j ^ N — 1 и равны 0 для j ^ N . Некоторые коэффици­ енты модели можно определять с помощью полиномов более вы­ сокого порядка путем подгонки модели к результатам N последних наблюдений в каждый момент поступления новых данных. Таким образом, в самом общем случае значения коэффициентов в лю­ бой заданный момент времени зависят от предыдущих значений коэффициентов, от ошибки в прогнозе при использовании самого последнего наблюдения, а также от вида используемого полинома и, конечно, числа N результатов наблюдений.

В методе скользящей средней первоначальные значения элемен­ тов ряда заменяются их средней арифметической величиной внутри выбранного интервала. Полученное значение относится к середине выбранного интервала. Затем интервал сдвигается на одно наблюде­ ние и расчет средней величины ряда повторяется. Интервалы опре­ деления средней величины ряда берутся в течение всего времени одинаковыми. Чем шире интервал, тем более плавный вид име­ ет огибающая, проведенная по значениям элементов нового ряда. Сглаженный ряд короче первоначального на к— 1 наблюдений (к— величина интервала сглаживания).

Величина интервала сглаживания определяется конкретной задачей. Если число членов интервала сглаживания нечетное,

то полученное значение скользящей средней

-

X

У г + к

_ к =

0

Vi+m~ 2( m + l )

приходится на средний член интервала сглаживания. При четном числе членов интервала сглаживания значения скользящих средних будут располагаться в промежутках между элементами ряда

 

+ 2J У г + к +

У 1 + 2 т

Z

к = 0__________ f ________

V i + m —

2 т

 

 

 

Здесь y i значение г-го члена ряда, т целое положительное чис­ ло, определяющее величину интервала сглаживания, 1 ^ т ^ п /2:

п

 

если

п — четное число,

—,

т = I

т

 

 

п

1

если

п — нечетное число,

^ —-—,

п число членов ряда.

Если известно, что внутри интервала сглаживания имеет место нелинейный тренд, применяют взвешенные скользящие средние: внутри каждого интервала сглаживания значения элементов ряда описывают полиномом р-й степени:

р

У = а о + 2 a it1. i= 1

Параметры а о , о ь ..., а р полинома находят, например, мето­ дом наименьших квадратов или другими методами, описанными в гл. 7. Взвешенную скользящую среднюю для выбранного интер­ вала определяют как средний член сглаженных значений исходного ряда с помощью полинома.

Простота и наглядность — достоинства метода скользящей сред­ ней. Однако при малом числе наблюдений метод приводит к иска­ жению тренда, величина интервала сглаживания влияет на форму тренда, теряются начальные и конечные элементы ряда.

Сглаживание рядов можно проводить и с помощью других функций и полиномов, а также с помощью метода конечных

разностей. Для элементов ряда можно вычислить первые разности А] = Уг+1 - Уи вторые разности А? = Д ]+1 - А ! и т. д.

Если предположить, что элементы ряда можно описать поли­

номом р-й степени, то (р + 1)-я

производная этого полинома бу­

дет всюду равна нулю, т. е. +

1)-я разность элементов такого ря­

да будет равна нулю. Таким образом, взяв р-ю разность от чле­ нов ряда, рассмотрим ряд, в котором исключен тренд, выраженный полиномом р-й степени.

§ 10.4. Прогнозирование с помощью экспоненциального сглаживания

Для стационарных рядов существует система весовых множите­ лей, позволяющая обеспечить минимальную ошибку прогноза. Эти множители определяются видом автоковариационной функции. Из­ вестен метод вычисления таких оптимальных весовых функций для постоянного уровня, тренда и сезонных коэффициентов. В каждом из этих случаев весовые множители уменьшаются согласно поведе­ нию показательной функции а? при а < 1, а различные значения а , получаемые для уровня, тренда и сезонных коэффициентов, опре­ деляются систематическими исследованиями точности прогнозов, получаемых при различных комбинациях весовых функций.

Во многих случаях целесообразно использовать последователь­ ность (ùj = а?9 а < 1, j = 1, 2, . .. , придающую более высокий вес более поздней информации и позволяющую относительно про­ сто оценивать значения коэффициентов даже достаточно сложных моделей, таких, в которых для описания сезонных циклов использу­ ются полиномы в сочетании с преобразованиями Фурье (подобное представление можно рассматривать как сложные полиномы). Для модели экспоненциально взвешенного скользящего среднего пред­ ложены способы, с помощью которых в те периоды времени, когда средняя ошибка прогноза близка к нулю (благодаря верно выбран­ ным модели и ее коэффициентов), скорость убывания последова­ тельности аР может быть увеличена, а в те периоды времени, когда средняя ошибка прогноза значительно больше нуля и существует опасность того, что модель может «забыть» старую информацию (в этом случае требуется уточнение прогноза), скорость убыва­ ния а-7 может быть уменьшена.

Уточнение прогноза проводят по принципу обратной связи: новые прогнозы корректируют на основе учета ошибок в пред­ шествующих прогнозах. Если при выборе весовых множителей в процессе составления прогноза также используется обратная связь, то не только строгий анализ областей устойчивости дан­ ной системы, но и любой другой анализ становятся фактически невозможными. Для анализа эффективности какого-либо метода недостаточно привести примеры, подтверждающие его полезность. Необходимо также выявить области (если они существуют), в кото­ рых применение рассматриваемого метода невозможно или неэф­ фективно.

Многие методы позволяют отыскать наилучшее значение скоро­ сти затухания весовых множителей путем многократного анализа имеющегося ряда данных. При этом в качестве критерия использу­ ется достигаемая точность прогноза (минимальная дисперсия оши­ бок). Однако такой подход содержит и недостатки.

Во-первых, если в средней ошибке есть значимые разности (они должны быть равны нулю), то более вероятно, что эти разности больше зависят от способа выбора начальных значений коэффи­ циентов модели, чем от различий в скорости затухания весовых множителей или постоянной сглаживания.

Во-вторых, еще более важный источник возможной ошибки можно проиллюстрировать с помощью следующего примера. Будем рассматривать очень длинный ряд чисел как некоторый корре­ лированный процесс. Этот ряд, стационарность и однородность которого гарантирована самим способом его получения, разобьем на короткие отрезки, содержащие достаточно данных для отыска­ ния наилучшего значения скорости затухания весовых множителей. Проведем анализ результатов, полученных для каждого из этих отрезков. Несмотря на то, что все отрезки относятся к одному и то­ му же процессу, тем не менее, существует широкое распределение соответствующих значений скорости затухания. Определить ско­ рость затухания для данного отрезка можно только после того, как он стал предысторией. Величина скорости затухания на следующем отрезке, которая может быть другой, будет известна только после определения ее для данного отрезка, и, следовательно, для прогноза такие значения вообще бесполезны.

Разность между точностью, получаемой при постоянном ис­ пользовании некоторой стандартной скорости затухания весовых множителей, например при а = 0,9, и точностью, которая может быть достигнута при заранее известном оптимальном значении ско­ рости затухания, относительно мала по сравнению с выборочной ошибкой скорости затухания в том случае, когда наилучшее значе­ ние весовых множителей для длинного ряда выбирается по данным для коротких отрезков этого ряда.

Рассмотрим метод экспоненциального сглаживания полиномом степени р :

представленного п членами (t = 1, 2, . . . , ri).

Экспоненциальной средней первого порядка для ряда yt назовем

п

Л ) = « 2 ( 1 - с о ^ - ь г=0

где 0 < а < 1 — параметр сглаживания, который выбирается априори.

Экспоненциальная средняя k-го порядка для ряда yt имеет вид

5 t[fcl(y) = a | ; ( l - a ) i5 £ 7 ll(y). i=0

Справедлива следующая рекуррентная формула [41]:

5,[fc](y) = aSt[fe- 1](y) + (1 -

« )5 Й (у ),

откуда имеем

 

 

 

S}4(v) = т + (1 -

a)5{i],(y) =

 

= ayt + ( l -

a)[ayt-i + (1 -

a)S[i]2(y)] =

= ayt + a(l -

a)yt- i

+ (1 - a)2 [ayt- 2

+ (1 - a)5t[i]3(y)] =

 

 

t-

1

 

 

= a

- <*yyt-i + (1 - а)гу0.

 

 

1=0

17 — 4077

Веса (коэффициенты при S\k\y )), присвоенные наблюдениям, убывают в геометрической прогрессии:

St[2](y) = a S \% ) + (1 - а)5р_],(у),

Sln](y) = *S\n- '\ y ) + (1 - a)S H (y ).

Прогноз значений динамического ряда у* в момент t + 1 после t = п строится с помощью ряда Тейлора:

i f + (# ? > +

где у ^ p-я производная, взятая в момент t.

Для линейной модели yt = CLQ + a\t прогноз вычисляется по фор­

муле yt+i = ao + lâ \\ для квадратичной модели yt = оо + ai t + у a2t2 получим

Vt+i = a0 + ( ai + у l2a 2.

Оценки параметров So, Si для линейной модели и So, S i, S2 для квадратичной модели находятся соответственно из систем уравне­ ний, связывающих искомые параметры с экспоненциальными сред­ ними.

В первом случае получаем систему уравнений

sFw-ao-i^a,, зР'(у)=ао-Н1^>гь

откуда имеем

S0 = 2SP](y)-SP](y),

2 i = T^ ( s l % ) - s \ 2]m

Ошибка прогноза при этом определяется следующим образом:

о ( У ш ) =

(1 + 4(1 - а) + 5(1 - а2) + 2а(4 - За)/ + 2 * Ч 2),

Соседние файлы в папке книги