Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа1 Баженова.docx
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
1.49 Mб
Скачать

Этап 6. Выбор лучшей модели прогноза.

Составим таблицу сравнения наилучших моделей:

Модель

RMSE для всей выборки

RMSE для тестовой выборки

Модель Брауна α=0,7245

17,6348

0,24451

ARIMA (2,0,2) с константой

16,4457

0,213783

Таким образом, наилучшей моделью является ARIMA модель (2,0,2) c константой.Обе среднеквадратические ошибки данной модели меньше, чем для модели Брауна.

Этап 7. Построение прогноза по полученной модели.

Построим прогноз на следующий период по полученной модели:

Lower 95,0%

Upper 95,0%

Period

Forecast

Limit

Limit

61,0

136,859

86,3597

187,358

Этап 8. Спектральный анализ временного ряда. Оценка сезонных колебаний. Оценка точности прогнозирования уровня показателя.

Цель спектрального анализа – разложение дисперсии временного ряда по частотам для определения существенных гармонических составляющих стационарного процесса.

Спектр – это функция распределения амплитуд процесса по соответствующим частотам.

На данном этапе необходимо оценить временной ряд «Индекса промышленного производства

Исходя из графика, можно сказать, что тренда (зависимости показателя от времени) нет и есть сезонность. Проверим данное предположение с помощью гипотез.

1. Обнаружение и идентификация тренда Гипотеза о равенстве дисперсий.

Так же воспользуемся Statgraphics:

1/2

1/2

Standard deviation

6,11699

5,9964

Sample sizes

56

57

Null Hypothesis: ratio of variances = 1,0

Alternative: not equal

Computed F statistic = 1,04063

P-Value = 0,880933

Do not reject the null hypothesis for alpha = 0,05.

На основе, данных полученных при использование Statgraphics можно сделать вывод, что нулевая гипотеза о равенстве дисперсий принимается.

Гипотеза о равенстве средних.

Делим исходные данные на 2 равные части и проверим о гипотезу, о равенстве их средних, воспользовавшись Statgraphics:

Sample means

100,425

100,207

Sample standard deviations

6,11699

5,9964

Sample sizes

56

57

Null Hypothesis: difference between means = 0,0

Alternative: not equal

Computed t statistic = 0,191307

P-Value = 0,848635

Do not reject the null hypothesis for alpha = 0,05.

Из результатов, полученных в Statgraphics можно сделать вывод о том, что нулевая гипотеза о равенстве средних двух реализаций подтверждается. Таким образом, можно сделать вывод об отсутствии тенденции.

2. Идентификация систематической составляющей в ряду.

Цель спектрального анализа – разложить дисперсию временного ряда по частотам для определения существенных гармоник.

Пара функций:

, называется гармоникой.

Общий вид оцениваемой регрессии на тригонометрические функции имеет вид:

Для начала определим m (предполагаемый период изменений):

Анализируя представленный выше рисунок, можно сделать предположение, что m=12. Данное предположение подтверждает изучение распределения значений спектра рады, представленное на Периодограмме и в таблице.

2013 год в выборке представлен не полностью, а только 5 месяцами. Чтобы не искажать этим картину, необходимо убрать последние 5 значений из выборки и перестроить периодограмму.

Cumulative

Integrated

i

Frequency

Period

Ordinate

Sum

Periodogram

0

0,0

4,36209E-26

4,36209E-26

1,14131E-29

1

0,00925926

108,0

1,0258

1,0258

0,000268393

2

0,0185185

54,0

10,3149

11,3407

0,00296722

17

0,157407

6,35294

7,71775

151,867

0,0397348

18

0,166667

6,0

252,339

404,206

0,105757

19

0,175926

5,68421

11,8434

416,049

0,108856

26

0,240741

4,15385

0,13799

535,622

0,140142

27

0,25

4,0

974,143

1509,76

0,395019

28

0,259259

3,85714

14,4301

1524,19

0,398794

35

0,324074

3,08571

42,9348

1599,76

0,418565

36

0,333333

3,0

1147,42

2747,18

0,718781

37

0,342593

2,91892

2,04179

2749,23

0,719315

45

0,416667

2,4

659,713

3502,84

0,916493

46

0,425926

2,34783

15,7478

3518,59

0,920613

53

0,490741

2,03774

57,1675

3734,89

0,977206

54

0,5

2,0

87,1204

3822,01

1,0

Как видно на периодограмме и соответствующей таблице в приложение самому наибольшему колебанию соответствует период в , т.е. период получается длиной ровно 3 месяца.

m =

3

n =

108

h =

36

j =

1,5

Воспользовавшись методом НМК, получаем следующие параметры модели и их значимость по t-статистике:

100,3778

210,1392

значим

100,3778

a =

4,080556

tрасч =

6,040513

значим

a (зн.) =

4,080556

-2,14421

-3,17412

значим

-2,14421

0,898148

1,880258

незначим

0

tкрит =

1,983

Проверка значимости коэффициентов по гармоникам:

Параметр

j=0

j=1

j=1,5

a2j-1

100,38

4,08

0,9

cos

a2j

 

-2,14

 

sin

tрасч a2j-1

 

 

tрасч a2j

 

 

a2j-1 значимость

 

 

 

a2j значимость

 

 

 

Амплитуда ρ

 

4,61

 

Период mj=12/j

 

3

2

Fрасч

 

23,28

0,00

Fкрит

 

3,082852

3,082852016

 

значима

P-value

 

0,0000

1,0000

По t-статистике вышло, что коэффициент вышел незначимым, следовательно, его можно убрать из модели:

Y(t) =100,38 + 4,08cos( ) – 2,14sin( )