Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5417.pdf
Скачиваний:
7
Добавлен:
13.11.2022
Размер:
1.39 Mб
Скачать

19

том, что при прогнозировании на период t учитывается ошибка предыдущего прогноза.

Экспоненциальное сглаживание – широко распространенный метод прогнозирования из-за легкости вычисления. Для коротких временных рядов, которые часто встречаются в экономике, важным представляется выбор начальной оценки прогноза. Для этой цели могут быть использованы разные приемы: среднее значение нескольких первых периодов; субъективные оценки, полученные экспертным путем; первое фактическое значение уровня динамического ряда как прогноз для периода 2. Если принять последний подход, то, используя данные таблицы

3.2.1, при

 

0,5 получим прогнозные значения (таблица 2.4.1).

S0

1

 

3

 

yt

15,4

16,1

16,5

16 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 t 1

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S1

S0

 

 

( yt

1

St

1 )

16,0

 

0,5

(15,4

16)

15,7 ;

 

S2

 

S1

( yt

1

St

1 )

 

15,7

 

0,5

(16,1

15,7) 15,9 ;

 

S3

15,9

0,5

(16,5

15,9)

16,2 ;

 

 

 

 

p

 

 

 

( yt 1

St

1 )

 

15,4

15,7 −0,3;

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p2

 

 

 

16,10

15,9

 

0,2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.4.1 – Расчетные данные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Годы

 

 

 

 

 

Общая

 

площадь

 

жилых

 

Прогноз

Ошибка прогноза

 

 

 

 

 

 

помещений,

приходящаяся в

S1

St 1 ( yt 1 St 1 )

p ( yt 1 St 1 )

 

 

 

 

 

 

среднем на 1 жителя, м2, y

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1992

 

 

 

 

 

 

 

 

 

 

 

 

15,4

 

 

 

 

 

15,70

-0,30

1993

 

 

 

 

 

 

 

 

 

 

 

 

16,1

 

 

 

 

 

15,90

0,20

1994

 

 

 

 

 

 

 

 

 

 

 

 

16,5

 

 

 

 

 

16,20

0,30

1995

 

 

 

 

 

 

 

 

 

 

 

 

16,6

 

 

 

 

 

16,40

0,20

1996

 

 

 

 

 

 

 

 

 

 

 

 

16,9

 

 

 

 

 

16,65

0,25

1997

 

 

 

 

 

 

 

 

 

 

 

 

17,0

 

 

 

 

 

16,83

0,17

1998

 

 

 

 

 

 

 

 

 

 

 

 

17,1

 

 

 

 

 

16,96

0,14

1999

 

 

 

 

 

 

 

 

 

 

 

 

17,9

 

 

 

 

 

17,43

0,47

2000

 

 

 

 

 

 

 

 

 

 

 

 

18,2

 

 

 

 

 

17,82

0,38

2001

 

 

 

 

 

 

 

 

 

 

 

 

18,5

 

 

 

 

 

18,15

0,35

2002

 

 

 

 

 

 

 

 

 

 

 

 

19,3

 

 

 

 

 

18,73

0,57

2003

 

 

 

 

 

 

 

 

 

 

 

 

19,5

 

 

 

 

 

19,11

0,39

2004

 

 

 

 

 

 

 

 

 

 

 

 

19,7

 

 

 

 

 

19,40

0,30

2005

 

 

 

 

 

 

 

 

 

 

 

 

19,9

 

 

 

 

 

19,41

0,49

2006

 

 

 

 

 

 

 

 

 

 

 

 

-

 

 

 

 

 

19,65

-

20

Рассмотренные экспоненциальные средние представляют собой средние первого порядка, т.е. средние, полученные при сглаживании уровней динамического ряда (первичное сглаживание). При прогнозировании могут использоваться экспоненциальные средние более высоких порядков, т.е. средние, полученные путем многократного сглаживания. Экспоненциальная средняя k -го порядка определяется по формуле

Q(k )

Q(k 1)

(1

) Q(k ) .

t

t

 

t 1

Если k =1, то получаем формулу расчета экспоненциальной средней первого порядка:

Q(1)

Q0

(1

) Q(1)

y (1

) Q(1)

,

t

t

 

t 1

t

t 1

 

т.е. получили ту же формулу, которую ранее использовали при сглаживании исходного динамического ряда (таблица 2.3.1).

Если k 2 , то получаем формулу расчета экспоненциальной средней второго порядка:

Q(2)

Q(1)

(1

) Q(2)

,

t

t

 

t 1

 

т.е. сглаживанию подвергаются экспоненциальные средние первого порядка.

Если k 3 , то получаем формулу расчета экспоненциальной средней третьего порядка:

Q(3)

Q(2)

(1

) Q(3)

,

t

t

 

t 1

 

т.е. сглаживанию подвергаются экспоненциальные средние второго порядка.

Экспоненциальные средние более высоких порядков рекомендуются к применению, если после сглаживания исходного динамического ряда тенденция ряда проявляется недостаточно четко.

Экспоненциальные средние второго, третьего порядков нашли применение в адаптивном прогнозировании по полиномиальным моделям.

2.5. Адаптивное прогнозирование по полиномиальным моделям

Английский ученый Р. Браун предложил использовать экспоненциальные средние в прогнозировании для вычисление поправок коэффициентов сглаживающего полинома. Предположим, что для прогноза использован линейный тренд

 

a0 a1t .

yt

21

Согласно теореме Брауна-Майера параметры линейного тренда связаны

с экспоненциальными средними первого Q(1)

и второго Q(2)

порядков:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

t

 

 

 

Q(1)

 

 

 

 

 

 

1

 

 

 

 

 

 

;

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

0

 

 

 

 

 

1

 

 

 

 

Q(2)

 

 

 

 

2(1

 

 

)

 

 

 

.

 

a

 

 

a

 

 

 

 

t

0

 

 

 

 

 

 

 

 

 

 

 

1

 

Соответственно:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2Q(1)

Q(2) ;

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

t

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Q(1)

 

Q(2) ) .

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

t

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из формулы расчета экспоненциальных средних нам известно, что

необходимо задать начальные условия Qk

, т.е. определить Q(1)

и Q(2) .

 

 

 

t 1

0

0

Начальные условия задаются в виде следующих формул:

 

Q(1)

a

1

 

a ;

 

 

 

 

 

 

 

 

 

0

0

 

 

1

 

Q(2)

a

2(1

 

)

a .

 

0

0

 

 

1

 

Предположим, что к динамическому ряду, представленному в таблице 2.3.1, применено аналитическое выражение в виде линейного тренда. Уравнение тренда составило:

 

 

 

 

 

ˆ

15,18

0,34t ,

 

 

 

 

 

 

 

 

yt

 

 

 

где t =1,2,…,14.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Параметр определим из формулы

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

0,133

0,1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

14 1

 

 

 

 

 

 

 

 

 

 

 

 

Соответственно:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

0,1

 

9 , а

 

 

 

 

0,1

 

0,11.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,1

 

 

1

1

0,1

 

Начальные условия для экспоненциального сглаживания в нашем примере окажутся:

 

Q(1)

 

a

1

a

15,18

9 0,34 12,12 ;

 

 

 

 

 

0

 

0

 

 

1

 

 

Q(

2)

a

2

(1

)

a

15,18

2 9 0,34 9,06 .

 

 

 

 

 

 

0

 

0

 

 

 

 

1

 

 

22

Исходя из формулы экспоненциальной средней, экспоненциальные средние Qt(1) и Qt(2) составят:

 

 

 

 

 

Q(1)

y

(1

 

) Q(1)

,

 

где yt

yt n , т.е. yt

 

t

t

 

 

t 1

Q0

;

15,18

0,34 14

19,94 и Qt 1

 

 

 

 

 

 

 

 

 

(1)

(1)

 

 

 

 

Q(1)

0,1 19,94

(1

0,1)

12,12

12,90;

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

Q(2)

Q(1)

(1

 

) Q(2) ,

 

 

 

 

 

 

t

t

 

 

t

1

 

где Q(2)

Q(2)

;

Q2

0,1 12,90 (1 0,1) 9,06

9,44 .

 

 

t 1

0

 

t

 

 

 

 

 

 

 

 

Тогда скорректированные параметры линейного тренда составят:

 

a

2 Q(1)

Q(2)

2 12,90 9,44 16,36 ;

 

0

 

t

t

 

 

 

 

 

a

 

 

 

(Q(1)

Q(2) )

0,11 (12,9 9,44) 0,38 .

 

 

 

1

1

 

t

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Прогноз проводим по модели

 

 

 

 

 

 

 

 

 

 

 

yp

 

 

0

 

 

 

 

 

 

 

a

a1l ,

где l − период упреждения.

В рассматриваемом примере прогноз на на 2006 г. составит (при l 1): yp 16,36 0,381 16,47 .

Соответственно про прогнозе на 2007 г. берем l 2 : yp 16,36 0,382 17,12 .

Если прогноз основывается только на уравнение тренда, то на 2006 г. он составит

yp

15,18

0,34 15

20,28,

 

 

 

 

а на 2007 г.

 

 

 

 

 

 

 

yp

15,18

0,34 16

20,62 .

 

 

 

 

Рассмотренные параметры линейного

тренда

 

0 и

 

 

a

a1 можно

корректировать на новую информацию. Так, после прогноза на 2006 г.

можно вновь определять

Q(1) и

Q(2) и на их основе можно строить новое

 

 

 

 

 

 

t

t

 

 

 

уравнение для прогноза на 2007г.

 

 

 

Если

ряд

 

динамики

описывается

параболой

второго

порядка

 

a1t

a2t

2

,

то рассчитываются экспоненциальные

средние

первого

y a0

 

( Q(1) ),

второго

( Q(2) ) и третьего ( Q(3) )

порядков. Модель, по

которой

t

 

 

 

 

t

 

t

 

 

 

осуществляется прогноз, имеет вид:

 

23

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

2

,

 

 

 

 

 

 

yt

a0 a1t

 

a2t

 

2

 

где a0 , a1 , a2 − оценки параметров уравнения тренда, скорректированные по экспоненциальному сглаживанию:

 

 

 

 

 

 

 

 

 

 

 

 

 

3(Q(1)

Q(2) )

Q(3) ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

t

 

 

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

[(6

5

)

Q(1)

2

(5

4

 

)

Q(2)

(4

3 ) Q(3)

] :

a

 

 

 

 

 

 

1

2 (1 )2

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Q(1)

2

Q(2)

Q(3) ) .

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

(1

 

)2

 

 

t

 

 

 

 

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Начальные условия

Qt 1

 

 

 

 

Q0

для экспоненциальных средних

разных

порядков определяются по формулам:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q(1)

a

1

 

 

 

a

(1

 

)

 

(2

 

)

 

a ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

0

 

 

0

 

 

 

 

 

 

1

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q(2)

 

a

2 (1

 

 

)

a

(1

 

) (3 2 )

 

a ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

 

Q(3)

a

3

 

(1

)

 

a

3

(1

 

 

) (4

3

)

 

a .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

0

0

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Экспоненциальные средние:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q(1)

 

 

 

y

(1

 

)

 

Q(1)

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

t

 

 

 

 

 

 

t 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q(2)

 

 

Q(1)

(1

)

Q(2)

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

t

 

 

 

 

 

 

t

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q(3)

 

 

Q(2)

(1

)

Q(3) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

t

 

 

 

 

 

 

t

1

 

 

 

 

 

 

 

Метод экспоненциального сглаживания для прогнозирования имеет как достоинства, так и недостатки. Достоинствами метода являются его простота, достаточная точность, которая возрастает с увеличением длины динамического ряда и снижается с ростом периода прогноза. К недостаткам можно отнести отсутствие точного выбора оптимальной величины параметра сглаживания . Данный метод эффективен при проведении краткосрочных прогнозов.

2.6. Процедура сглаживания в пакете STATGRAFICs

Пакет STATGRAFICS является модульной системой, которая состоит из основного (Special) и пяти вспомогательных модулей:

- модуль расширенного регрессионного анализа (Advanced Regression Module AR);

24

-модуль анализа временных рядов (Time Series Analyses Module TSA);

-модуль контроля качества (Quality Control Module − QC);

-модуль многомерных методов анализа (Multivariate Methods Module − MM);

-модуль планирования эксперимента (Experimental Design Module −

ED).

Основное меню STATGRAFICS содержит следующие пункты меню:

-File (управление данными, печатью и другие системные опции);

-Edit (процедуры редактирования);

-Plot (построение графиков);

-Describe (описательные статистики);

-Compare (сравнение данных);

-Relate (простая и множественная регрессия);

-Special (вызов дополнительных модулей);

-View (опции просмотра);

-Window (опции оконного и графического интерфейса)

-Help (доступ к справке STATGRAFICS).

Взаимодействие пользователя с пакетом осуществляется в диалоговом режиме. Начало работы с системой состоит из создания или загрузки существующей электронной таблицы (таблица 2.6.1, рисунок 2.6.1).

Например: Имеются следующие данные по площади жилищ, приходящейся в среднем на одного жителя – всего, м2 по Хабаровскому краю

(У) (таблица 2.6.1).

Таблица 2.6.1 − Площадь жилищ, приходящаяся на одного жителя, м2.

Год

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У

15,4

16,1

16,5

16,6

16,9

17,0

17,1

17,9

18,2

18,5

19,3

19,5

19,7

19,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25

Рисунок 2.6.1 − Электронная таблица STATGRAFICS

При прогнозировании социально-экономических явлений важное место занимают установление тренда и расчет его параметров. Модуль

STATGRAFICS Time-Series Аnalysis (Анализ временных рядов или сокращенно АВР) содержит процедуры, позволяющие строить модели одномерных временных рядов:

-Descriptive Methods Analysis (Описательные методы анализа)

Процедура позволяет установить структуру временных рядов с использованием разнообразных критериев;

-Smoothing (Сглаживание). Модуль осуществляет различные виды сглаживания;

-Seasonal Decomposition (Сезонное разложение). Процедура проводит разложение временного ряда;

-Forecasting (Прогнозирование). Модуль осуществляет прогнозы по различным моделям.

При определении формы связи отдельных временных рядов сложно

установить характер связи направления тренда из-за влияния циклических, сезонных, случайных и иных колебаний. Поэтому необходимо применять методы сглаживания, позволяющие минимизировать воздействие отмеченных колебаний.

26

В модуле Time-Series Аnalysis (АВР) выберем процедуру Smoothing

(Сглаживание), появиться панель ввода данных (рисунок 2.6.2):

Forecasting – прогнозирование; Data – данные (имя переменной); Sampling Interval

– выборочный интервал; Once Every – выбор времени; Year(s) – годы; Quarter(s)

кварталы; Month(s) – месяцы; Day(s) – дни; Hour(s) – часы; Minute(s) – минуты; Second(s) − секунды; Other – другое; Starting At – начинать с; (Seasonafity:)

сезонность; (Trading Days Adjustment:) − корректировка данных; (Select:) – выбор; Transform – трансформировать.

Рисунок 2.6.2 − Модуль ввода данных Smoothing (Сглаживание)

Система выведет в рабочей области сводку простого пятичленного сглаживания, установленного по умолчанию (рисунок 2.6.3)

Analysis Summary

Data variable: Y

Number of observations = 14

Start index = 1992

Sampling interval = 1,0 year(s)

First smoother: simple moving average of 5 terms

Second smoother: none

Рисунок 2.6.3 − Сводка простого пятичленного сглаживания

В табличных опциях (рисунок 2.6.4) установим флажок Date Table (таблица данных), а в графических – Time Sequence Plot (график временно последовательности) (рисунок 2.6.5).

27

Analysis Summary – резюме анализа; Date Table – таблица данных.

Рисунок 2.6.4 – Панель Tabular Options (Табличные опции). STATGRAFICS построит график (рисунок 2.6.6) и рассчитает сглаженные значения (рисунок 2.6.7).

Time Sequence Plot − график временно последовательности; Residual plot – график остатков.

Рисунок 2.6.5 - Панель Graphical Options (графические опции).

Щелкнем правой кнопкой мыши на табличной панели Date Table (Таблица данных) (рисунок 2.6.7). Появится всплывающее меню, в котором выберем пункт Pine Options (опции панели) (рисунок 2.6.8):

Smoothed TimeSeries Plot for Y

20

data

19

 

 

 

 

 

smooth

 

 

 

 

18

Y

17

16

15

1990

1993

1996

1999

2002

2005

Рисунок 2.6.6 − График изменения площади жилищ, приходящейся на одного жителя, м2.

Система предоставит возможность изменить метод сглаживания. Установим переключатель в поле EWMA (взвешенное экспоненциальное сглаживание) (рисунок 2.6.8)

Data Table for Y

 

 

 

28

First smoother: simple moving average of 5 terms

 

Second smoother: none

 

 

 

Period

Data

Smooth

Rough

----------------------------------------------------------------

1992

15,4

 

 

1993

16,1

 

 

1994

16,5

16,3

0,2

1995

16,6

16,62

-0,02

1996

16,9

16,82

0,08

1997

17,0

17,1

-0,1

1998

17,1

17,42

-0,32

1999

17,9

17,74

0,16

2000

18,2

18,2

0,0

2001

18,5

18,68

-0,18

2002

19,3

19,04

0,26

2003

19,5

19,38

0,12

2004

19,7

 

 

2005

19,9

 

 

----------------------------------------------------------------

Таблица Данных для Y

Первое сглаживание: простое скользящее среднее значение 5 сроков

Период Данные Сглаживание Остатки

----------------------------------------------------------------

1992

15,4

 

 

1993

16,1

 

 

1994

16,5

16,3

0,2

1995

16,6

16,62

-0,02

1996

16,9

16,82

0,08

1997

17,0

17,1

-0,1

1998

17,1

17,42

-0,32

1999

17,9

17,74

0,16

2000

18,2

18,2

0,0

2001

18,5

18,68

-0,18

2002

19,3

19,04

0,26

2003

19,5

19,38

0,12

2004

19,7

 

 

2005

19,9

 

 

----------------------------------------------------------------

Рисунок 2.6.7 − Таблица данных

Система рассчитает значение и построит график для взвешенного экспоненциального сглаживания с параметром 0,1 (рисунок 2.6.9).

29

Smoother – сглаживание; Simple Moving Average – простое скользящее среднее; Spencer's 15-Tem MA –

скользящие средние Спенсера по 15 точкам; Spencer's 21-Tem MA – скользящие средние по 21 точке;

Henderson's Weighted MA – средние взвешенные Хендерсона; EWMA (Exponentially Weighted Moving Average) − взвешенное экспоненциальное скользящее среднее; 3RSS, 3RSSH, 5RSS, 5RSSH, 3RSR – устойчивое нелинейное сглаживание (Число 3 или 5 означает расстояние, пробегаемое скользящей медианой. R предполагает повторное медианное сглаживание. Первая буква S обозначает выполнение специальной операции расщепления вершин и впадин временного ряда. Вторая S показывает, что будет выполнено второе расщепление. H свидетельствует об использовании скользящего взвешенного среднего с весами 1/4, 1/2 и 1/4); Length of Moving Average − длина скользящего среднего значения; EWMA Smoothing Constant – константа сглаживания для взвешенной экспоненциальной скользящей средней

( 0,1;0,3;0,5ит.д); None −ни один.

Рисунок 2.6.8 − Панель установки Smoothing Option (Опций сглаживания)

 

 

Smoothed TimeSeries Plot for Y

 

 

20

 

 

 

 

 

 

 

 

 

 

da ta

19

 

 

 

 

sm ooth

18

 

 

 

 

 

Y

 

 

 

 

 

17

 

 

 

 

 

16

 

 

 

 

 

15

 

 

 

 

 

1990

1993

1996

1999

2002

2005

Рисунок 2.6.9 − График для взвешенного экспоненциального сглаживания

с параметром

0,1

Определив общие закономерности изменения площади жилищ, приходящуюся на одного жителя, можно приступить к подбору модели и расчету прогнозных значений моделируемого показателя. С этой целью проводится моделирование одномерных рядов (в системе STATGRAFICS процедура Forecasting модуля АВР).

Контрольные вопросы к разделу 2 1. Объясните назначение скользящих средних. Влияние каких компонент временного ряда устраняется с их помощью?

30

2.Поясните, когда целесообразно использовать простые скользящие средние, а для каких временных рядов предпочтительнее применение взвешенных.

3.Приведите алгоритм расчета простых скользящих средних.

4.В чем отличие алгоритма расчета взвешенных скользящих средних от простых?

5.Сколько значений теряется при использовании скользящей средней с длиной интервала g = 2p+1?

6.Какие приемы восстановления потерянных уровней после реализации процедур сглаживания используются на практике?

7.Как рассчитываются простые скользящие средние при четной длине интервала сглаживания?

8.Укажите характерные особенности адаптивных методов прогнозирования.

9.Какие типы адаптивных моделей вы знаете?

10.Чем объясняется название «экспоненциальная средняя»?

11.

Какую роль играет параметр адаптации в процедуре сглаживания?

12.

Как влияет значение параметра на характер сглаженного ряда?

3. Методы моделирования одномерных временных рядов 3.1. Моделирование тенденции временного ряда

Наиболее распространенным и простым способом моделирования тенденции является аналитическое выравнивание временного ряда.

Наибольшее распространение имеют линейные тренды, общая формула которых имеет вид:

 

s

ˆ

a yt ,

yt

 

q

где yt − сглаженные (выравненные) значения уровня на момент t ;

at − вес, приписываемый уровню ряда, находящемуся на расстоянии от момента t ;

s − число уровней после момента t ; q − число уровней до момента t .

Процесс выравнивания состоит из двух основных этапов:

31

1)выбор типа кривой;

2)оценивание параметров кривой.

Существуют различные приемы, позволяющие выбрать форму кривой, достаточно хорошо аппроксимирующей действительное развитие. Наиболее простой путь – на основе построения графического изображения временного ряда. По виду графика подбирается уравнение кривой:

1) полиномы:

 

 

 

 

 

 

 

 

yt

a0

a1t − первой степени;

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yˆ

t

 

 

 

a

0

a t

 

 

 

a

t 2 − второй степени;

 

 

 

 

 

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

yˆ

t

a

0

 

 

a t

a

t 2

a

t 3

− третьей степени;

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

yˆ

t

 

a

0

 

a t

a

 

t 2

...

 

 

a

t k

k -й степени.

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

k

 

 

 

 

 

2) экспоненты:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

a0

a

t

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yt

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yˆ

t

a

0

 

ab1 b2t 2 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

yˆ

t

 

b

 

a

 

at

− модифицированная экспонента.

 

 

 

 

 

 

0

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3) логистическая кривая

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yt

 

 

 

 

 

 

 

k

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

1

 

a

0

e a1t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где e – основание натурального логарифма.

yˆ

t

kaa1t

и др.

 

0

 

Подбор функции тренда осуществляется на основе выявления закономерностей развития процесса с помощью эмпирических методов.

При обработке временных рядов с помощью статистических пакетов параметры процедур можно подбирать, используя графики результатов, а также интегральные характеристики качества прогноза:

Mean error (средняя ошибка):

 

1

n

ME

 

( yt yˆt ) ;

 

 

n t 1

Sums of squares (сумма квадрата ошибок):

 

n

 

 

 

SSE

ˆ

)

2

;

( yt yt

 

 

t 1

 

 

 

Mean square (средняя квадратическая ошибка):

32

 

1

n

 

yˆ

 

)2

;

MSE

 

( y

t

t

 

 

n t 1

 

 

 

 

 

 

 

 

 

Mean absolute error (средняя абсолютная ошибка):

MAE

1

 

n

 

n

yt yˆt ;

t 1

Mean absolute percentage error (средняя абсолютная относительная ошибка):

MAPE

1 n

y

t

yˆ

t

*100

;

 

 

 

 

 

 

n t 1

 

 

yt

 

 

 

 

 

 

 

Mean percentage error (средняя относительная ошибка):

MPE

1

 

n

 

n

yt

yˆt

 

 

 

 

 

 

 

*100,

t 1

 

yt

 

 

где yk − эмпирические данные; yˆ k − теоретические данные; t − время ( t 1,2,..., n);

n − объем ряда.

Недостатком средней ошибки (ME) является то, что положительные и отрицательные ошибки компенсируют друг друга, поэтому ME не является хорошим показателем качества модели. Средняя абсолютная ошибка (MAE) по сравнению со средней квадратической ошибкой (MSE) более устойчива к выбросам. При расчете средней относительной ошибки (MPE) отрицательные и положительные ошибки будут компенсировать друг друга. Поэтому для оценки качества модели лучше использовать среднюю относительную ошибку (MAPE).

В статистических программах для каждого уравнения тренда указываются коэффициент детерминации ( R 2 ), F − критерий Фишера. Чем выше R 2 , тем соответственно выше вероятность, что вариация уровней динамического ряда описывается данным уравнением тренда. Влияние случайного фактора оценивается как (1 R 2 ). Чем больше величина F −критерия, тем предпочтительнее данное уравнение тренда.

33

3.2. Модели автокорреляции и авторегрессии

Для совершенствования однофакторного прогнозирования целесообразно использовать модели автокорреляции и авторегрессии.

Автокорреляция – это корреляционная зависимость между последовательными (соседними) значениями уровней временного ряда.

Чтобы оценить эту степень зависимости рассчитывают коэффициенты автокорреляции между уровнями исходного ряда и того же ряда, но со сдвинутыми на шагов во времени:

ryt yt

 

yt yt

 

yt

* yt

,

 

 

 

t

*

y

t

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

где yt − уровни исходного ряда;

 

 

 

 

 

 

 

yt − уровни того же динамического ряда, но сдвинутые на

шагов

во времени;

 

 

 

 

 

 

 

− величина лага, принимающая значения 1, 2, 3 и т.д. и

определяющая порядок коэффициента автокорреляции. При

1

рассчитывают коэффициент автокорреляции первого порядка ( ra

 

), т.е.

 

 

 

 

 

 

 

1

 

оценивается корреляция текущих значений временного ряда ( yt ) с

предшествующими значениями ( yt 1 ).

С увеличением величины лага () увеличивается порядок автокорреляции:

ra2

− автокорреляция второго порядка;

ra3

− автокорреляция третьего порядка;

……..

ra

− автокорреляция порядка .

Коэффициент автокорреляции практически рассчитывается по формуле линейного коэффициента корреляции. Поэтому его значения изменяются в пределах 1 ra 1. Чем ближе его значения к 1, тем сильнее зависимость текущих уровней динамического ряда от предыдущих.

При анализе временных рядов необходимо знать, существует автокорреляция в уровнях ряда или нет. Самым распространенным методом проверки автокорреляции является критерий Дарбина - Уотсона.

34

Критерий Дарбина–Уотсона оценивает автокорреляцию остатка. Если

автокорреляция в остатках ( yt

yt

) отсутствует, то уравнение пригодно для

 

ˆ

 

 

 

прогноза.

 

тренда предполагается, что lt

 

 

При построении уравнения

yt

yt

 

 

 

 

ˆ

представляют собой случайные величины, независимые переменные, среднее значение которых равно нулю ( lt 0 ). Однако это предположение имеет место, если вид функции выбран правильно. В противном случае наблюдается корреляция остатков за текущий ( lt ) и предыдущий ( lt 1 ) моменты времени.

Чтобы суждение об автокорреляции остатков не было субъективным, для ее оценки используется критерий Дарбина − Уотсона:

 

(lt

lt 1 )2

 

d

 

 

 

.

 

 

lt2

 

 

 

 

 

 

 

Сравнивая фактическое значение

( d )

с

табличным при заданном

n (число уровней динамического ряда)

и

m

(числе параметров при t в

уравнениях тренда), судим о наличии или отсутствии автокорреляции в остатках.

Если автокорреляция отсутствует, то d 2 , при сильной положительной

автокорреляции d 0 ,

в случае сильной отрицательной автокорреляции

d 4 .

 

Значения критерия

Дарбина − Уотсона при 5% значимости

представлены в приложении А. В этой таблице du верхняя доверительная граница критерия Дарбина − Уотсона, dl − нижняя.

Применение на практике критерия Дарбина − Уотсона основано на

сравнении величины d , рассчитанной по формуле

с теоретическими

значениями du

и dl , взятыми из таблицы.

 

 

 

Если вычисляемое значение d находится в пределах от du до ( 4

du ), то

гипотеза об отсутствии автокорреляции не отклоняется,

если же dl

d

du

или

4 du

d

4 dl , то нет статистических оснований ни принять ,

ни

отклонить

эту

гипотезу (область неопределенности).

Если d

d l

или

d

4 dl , то это указывает на наличие автокорреляции.

 

 

 

35

 

_______________________________________________

 

есть

 

 

?

 

 

dl

du нет 4 du ? 4 dl есть

(+)

 

 

 

(-)

По длинному динамическому ряду можно определить серию коэффициентов автокорреляции, последовательно увеличивая величину лага: ra1 , ra2 , ra3 ,..., ra . Последовательность значений автокорреляции называют автокорреляционной функцией. Эта функция дает представление о внутренней структуре динамического ряда. С помощью автокорреляционной функции можно определить наличие или отсутствие в ряду динамики периодических колебаний и соответственно величину периода колебаний: он равен величине лага , при которой коэффициент автокорреляции наибольший.

Одним из важных вопросов анализа авторегрессии является определение порядка авторегрессионной модели. Низкий порядок модели может дать существенные результаты, так как в модели не использована важная информация за предыдущие моменты времени. Повышение порядка авторегрессионной модели может привести к снижению качества модели, поэтому анализ авторегрессии не ограничивается построением только одной модели, строится несколько моделей, по которым определяется ее порядок. Сначала строится уравнение авторегрессии первого порядка:

ˆ

a0 a1 yt 1 ,

yt

и для нее находится коэффициент автокорреляции. Затем строится модель второго порядка:

ˆ

a0 a1 yt 1 a2 yt 2 .

yt

Для нее рассчитывается совокупный коэффициент автокорреляции R1 . Если R1 будет превышать r1 , то переходят к построению модели третьего порядка. Для этой модели также рассчитывается совокупный коэффициент автокорреляции R2 , который сравнивается с предыдущим. Эти расчеты повторяются до тех пор, пока множественный коэффициент автокорреляции практически станет неизменным при добавлении

36

очередных уровней. Коэффициент множественной автокорреляции определяется по формуле

Rk r1 1 r2 2 ... rk k ,

где i − коэффициенты регрессии в стандартизованном масштабе; ri − парные коэффициенты корреляции.

Выбранная модель может быть использована при краткосрочном прогнозирования.

3.3. Доверительные интервалы прогноза

Заключительным этапом применения моделей одномерных временных рядов является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение значений времени t , соответствующих периоду упреждения (прогноза). Полученный таким образом прогноз называется точечным, так для каждого момента времени определяется только одно значение прогнозируемого показателя.

На практике в дополнение к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, т.е. вычислить интервальный прогноз.

Несовпадение фактических данных с точечным прогнозом по одномерным временным рядам может быть вызвано:

1)субъективной ошибочностью выбора вида уравнения;

2)погрешностью оценивания параметров уравнения;

3)погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда и возможность отклонения от этого тренда определяются в виде:

yˆn L t S p ,

где n − длина временного ряда;

 

37

L − период упреждения;

yn

L − точечный прогноз на момент n L ;

ˆ

 

t

− значение t −статистики Стьюдента;

S p

− средняя квадратическая ошибка прогноза.

Предположим, что тренд описывается линейной моделью:

уˆt a0 a1t .

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность.

Погрешность параметра

а0

приводит к

вертикальному сдвигу

прямой,

погрешность параметра

 

а1

− к изменению угла наклона прямой

относительно линий тренда, дисперсию S p2

 

можно представить в виде:

 

 

 

 

 

 

 

S y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2

 

 

 

 

 

S 2

 

 

(t

t

 

S 2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

p

 

n

 

 

 

 

y

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(t

 

 

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где S y2 − дисперсия отклонений фактических наблюдений от расчетных;

t1 − время упреждения, для которого делается экстраполяция; t1

n L ;

t

− порядковый номер уровней ряда, t

 

 

1,2,3,..., n ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

− порядковый номер уровня, стоящего в середине ряда; t

(n

1) : 2

 

 

Тогда доверительный интервал можно представить в виде:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

(t

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

yˆn L t

 

 

S y

 

 

 

 

1

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(t

 

 

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

1

(t

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обозначим К

t

 

. Значение К зависит только от n и

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(t

 

 

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L , т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значения K или K * t K . Тогда интервальная оценка будет иметь вид:

ˆ

S y K

*

.

yn L

 

Выражение доверительного интервала для полинома второго порядка:

 

 

 

 

38

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t 2

 

 

 

t 4

(2 t 2 )t 2

nt 4

 

yˆ n L

t S y

1

1

 

 

 

 

1

1

 

 

t

2

 

n

t 4 ( t 2 )2

 

 

 

 

 

 

 

 

 

 

или

yn L

 

 

S y K

*

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением

 

 

n

 

 

 

 

 

 

 

 

 

( y

t

yˆ

t

)2

 

 

 

 

 

 

 

 

 

S 2

t 1

 

 

 

 

 

,

 

 

 

 

 

 

 

 

y

n

 

k

 

 

 

 

 

 

 

 

 

 

где yt

− фактические значения уровней ряда;

yt

− расчетные значения уровней ряда;

ˆ

 

 

 

 

 

 

 

 

n − длина временного ряда;

 

 

 

 

 

 

k

число оцениваемых параметров.

 

 

Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.

Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения.

Доверительные интервалы прогнозов, полученных с использованием показательной модели, определяются аналогичным образом. Отличие состоит в том, что при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).

3.4. Характеристика точности модели

Важнейшими характеристиками качества модели, выбранной для прогнозирования, являются показатели ее точности. Они описывают величины случайных ошибок, полученных при использовании модели. Таким образом, чтобы судить о качестве выбранной модели, необходимо

39

проанализировать систему показателей, характеризующих как адекватность модели, так и ее точность.

О точности прогноза можно судить по величине ошибки (погрешности) прогноза.

Ошибка прогноза – величина, характеризующая расхождение между фактическим и прогнозным значением показателя.

Абсолютная ошибка прогноза определяется по формуле

 

 

ˆ

yt ,

 

 

t yt

где

yt

− прогнозное значение показателя;

 

ˆ

 

 

 

yt

− фактическое значение.

 

Эта характеристика имеет ту же размерность, что и прогнозируемый показатель, и зависит от масштаба измерения уровней временного ряда.

На практике широко используется относительная ошибка прогноза, выраженная в процентах относительно фактического значения показателя:

 

yˆt yt

*100.

е

 

 

yt

Также используются средние ошибки по модулю (абсолютные и относительны):

n

yˆt yt

t 1

;

 

 

 

n

1

n

n

yˆt

yt

 

 

 

 

*100 ,

t 1

 

yt

 

 

где n - число уровней временного ряда, для которых определялось прогнозное значение.

Если абсолютная и относительная ошибки больше 0, то это свидетельствует о «завышенной» прогнозной оценке, если меньше 0, то прогнозное значение было занижено.

Очевидно, что все указанные характеристики могут быть вычислены после того как период упреждения уже закончился, и имеются фактические данные о прогнозируемом показателе или при рассмотрении показателя на ретроспективном участке.

40

В последнем случае имеющаяся информация делится на две части: по первой оцениваются параметры модели, а данные второй части рассматриваются в качестве фактических. Ошибки прогнозов, полученные ретроспективно (на втором участке), характеризуют точность применяемой модели. На практике при проведении сравнительной оценки моделей могут использоваться такие характеристики качества, как дисперсия ( S 2 ) или среднеквадратическая ошибка ( S ):

 

n

 

 

 

 

 

 

 

 

( yˆ

t

y

)2

 

 

 

 

 

 

t

 

 

 

 

 

S 2

t 1

 

 

 

,

S

S 2 .

 

 

n

 

 

 

 

 

 

 

 

 

Чем меньше значения этих характеристик, тем выше точность модели. На практике в качестве знаменателя в формуле для дисперсии принимают величину ( n k ), где k − число оцениваемых коэффициентов модели.

О точности модели нельзя судить по одному значению ошибки прогноза. О качестве применяемых моделей можно судить лишь по совокупности сопоставлений прогнозных значений с фактическими.

Простой мерой качества прогнозов может стать − относительное число случаев, когда фактическое значение охватывалось интервальным прогнозом:

 

p

 

 

 

,

 

 

p q

 

где p − число прогнозов, подтвержденных фактическими данными;

q − число прогнозов, не подтвержденных фактическими данными.

Когда все прогнозы подтверждаются, то q 0 и

1.

Если же все прогнозы не подтвердились, то p 0 и

0 .

Отметим, что при сопоставление коэффициентов

для разных моделей

может иметь смысл при условии, что доверительные вероятности приняты одинаковыми.

41

3.5. Возможности пакета STATGRAFIC при однофакторном прогнозировании

Выберем в пункте Специальный (Special) главного меню модуль

Анализ временных рядов (Time–Series Analysis). Система выдаст входную панель Forecasting (Прогнозирование) (рисунок 3.5.1).

В поле Data (данные) введем имя переменной splan 1 (х или у), установим кнопку Year(s) (годы). Number of Forecasts (период упреждения, прогноза) выбираем 1/3 исследуемого временного ряда (рисунок 3.5.1).

Forecasting – прогнозирование; Data – данные (имя переменной); Sampling Interval

– выборочный интервал; Once Every – выбор времени; Year(s) – годы; Quarter(s)

кварталы; Month(s) – месяцы; Day(s) – дни; Hour(s) – часы; Minute(s) – минуты; Second(s) − секунды; Other – другое; Starting At – начинать за; (Seasonafity:)

сезонность; (Trading Days Adjustment:) − корректировка данных; (Select:) − выбор;

Number of Forecasts – период упреждения (прогноза); Withhold of Validation – скрыть действия; Transform – трансформировать.

Рисунок 3.5.1 − Окно Forecasting (входная панель процедуры прогнозирования)

После нажатия кнопки OK система выдаст сводку предварительного анализа Analysis Summary (резюме анализа). Для вывода на экран результатов анализа по нескольким трендовым моделям необходимо нажать вторую кнопку слева (рисунок 3.5.2)

Рисунок 3.5.2 – Панель инструментов.

42

Появится окно Tabular Options (табличные Опции) (рисунок 3.5.3). Выберем операцию Model Comparison (сравнение моделей), затем нажмем OK.

Analysis Summary − резюме Анализа; Forecast Table − таблица Прогноза; Model Comparison

сравнение моделей; Residual Autocorrelations − остаточные автокорреляции; Residual Partial Autocorrelations − остаточная частные автокорреляции; Residual PeriodogramTable− остаточная таблица периодoграмм;ResidualTestsforRandomness − остаточныекритерии случайности.

Рисунок 3.5.3 − Oкно Tabular Options (табличные опции)

Щелкнем на панели правой кнопкой мыши и в появившемся окне выберем Analysis Options (опции анализа) (рисунок 3.5.4)

Pane Options − опции области окна; Analysis Options − опции анализа; Print

напечатать; Copy to Gallery − копия к галерее.

Рисунок 3.5.4 – Контекстовое меню

Система STATGRAFICS покажет модуль Model Specification Option

(опции спецификации модели) (рисунок 3.5.5).

43

Model– модель; None−ни один; Math–математика; Naturallog–натуральныйлогарифм;Base10log

основание десятичного логарифма; Square root − квадратный корень; Reciprocal − обратная величина; Power − степень; Box-Cox– основной блок; Addend – слагаемое;Type – Тип; RandomWalk – случайная выборка; Mean – средний; Linear Trend − линейная тенденция; Quadratic Trend − квадратическая тенденция; Exponential Trend − показательная тенденция; S-CurveS-кривая; Moving average − скользящее среднее значение; Simple Exp. Smoothing − простое экспоненциальное сглаживание; Brown´s Linear Exp. Smoothing – линейное экспоненциальное сглаживание Брауна; Holt´s Exp. Smoothing – линейное экспоненциальное сглаживание Хольта; Quadratic Exp. Smoothing – квадратическое экспоненциальное сглаживание; Winter´s Exp. Smoothing − экспоненциальное сглаживание Винтера; ARIMA Model – объединенная модель авторегрессии и скользящего среднего; Seasonal – сезонность;

Multiplicative – мультипликативный; Additive – аддитивный; Differencing − различия; Nonseasonal Order

несезонная последовательность; Seasonal Order − сезонная последовательность; Inflation – наполнение; Apply at − применить в; End of Period − конец периода; Middle of Period − середина периода; Rate – норма; ParametersandTerms-параметрыисроки;Optimize– оптимизировать; Constant–постоянный.

Рисунок 3.5.5 − Модуль Model Specification Option (опции спецификации модели)

Учитывая, что STATGRAFICS может сравнивать одновременно пять типов моделей, оптимизируя их параметры, выберем для анализа Linear Trend (линейная тенденция), Quadratic Trend (квадратическая тенденция), Exponential Trend (показательная тенденция) и S-Curve (S- кривая). Указанные модели выбираются в окне Model Specification Option (опции спецификации модели) (рисунок 3.5.5) следующим образом. В области Model (модель) щелкнем на пункте А, а в области Type (тип) установим флажок Linear Trend (линейная тенденция). Затем выберем пункт В и установим флажок на Quadratic Trend (квадратическая тенденция). Для модели С выберем Exponential Trend (показательная тенденция). Для модели D установим флажок в поле S-Curve ( S-кривая). Остальные поля оставим со значением по умолчанию.

44

На рисунке 3.5.6. представлен листинг сравнения моделей.

Model Comparison

----------------

Data variable: y

Number of observations = 14 Start index = 1

Sampling interval = 1,0 year(s)

Models

 

 

 

 

 

------

 

 

 

 

 

(A) Linear trend = 15,1791 + 0,343736 t

 

 

 

(B) Quadratic trend = 15,3522 + 0,278832 t

+

0,00432692 t^2

(C) Exponential trend = exp(2,7284 + 0,0193701 t)

 

(D) S-curve trend = exp(2,93191 + -0,25073

/t)

 

 

(E) Simple exponential smoothing with alpha =

0,9999

 

Estimation Period

 

 

 

 

 

Model MSE

MAE

MAPE

 

ME

MPE

------------------------------------------------------------------------

(A)

0,0528425

0,16562

0,945267

1,39571E-15 -0,0129212

(B)

0,0526901

0,161421

0,922914

5,07531E-16

-0,013535

(C)

0,0486203

0,16052

0,917722

0,00123114

-0,00682013

(D)

0,95851

0,811367

4,55073

0,0240537

-0,12694

(E)

0,180789

0,321464

1,80398

0,321454

1,80391

Model

RMSE

RUNS

RUNM

AUTO

MEAN

VAR

 

-----------------------------------------------

 

(A)

0,229875

*

OK

OK

OK

OK

 

(B)

0,229543

*

OK

OK

OK

OK

 

(C)

0,2205

*

OK

OK

OK

OK

 

(D)

0,979035

***

**

***

***

OK

 

(E)

0,425193

OK

OK

OK

OK

OK

 

Key:

RMSE = Root Mean Squared Error

RUNS = Test for excessive runs up and down

RUNM = Test for excessive runs above and below median

AUTO = Box-Pierce test for excessive autocorrelation

MEAN = Test for difference in mean 1st half to 2nd half

VAR = Test for difference in variance 1st half to 2nd half

OK = not significant (p >= 0.10)

*= marginally significant (0.05 < p <= 0.10)

**= significant (0.01 < p <= 0.05)

***= highly significant (p <= 0.01)

The StatAdvisor

---------------

This table compares the results of five different forecasting models. You can change any of the models by pressing the alternate mouse button and selecting Analysis Options. Looking at the error statistics, the model with the smallest mean squared error (MSE) during the estimation period is model C. The model with the smallest mean absolute error (MAE) is model C. The model with the smallest mean absolute percentage error (MAPE) is model C. You can use these results to select the most appropriate model for your needs.

The table also summarizes the results of five tests run on the residuals to determine whether each model is adequate for the data. An OK means that the model passes the test. One * means that it fails at the 90% confidence level. Two *'s means that it fails at the 95% confidence level. Three *'s means that it fails at the 99% confidence level. Note that the currently selected model, model D, passes only one test. Since one or more tests are statistically significant at the 95% or higher confidence level, you should seriously consider selecting another model.

Рисунок 3.5.6 − Листинг сравнения моделей прогнозирования Листинг содержит стандартную ошибку остатков (RMSE) и пять тестов

RUNS, RUNM, AUTO, MEAN и VAR.

RUNS (Test for excessive runs up and down) – тест на чрезмерное число пиков и впадин. Определяет количество повышений или понижений в

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]