- •Содержание
- •Лабораторная работа № 1 «Методы сбора и предварительного анализа исходных данных для эконометрического моделирования»
- •Решение типового примера
- •Лабораторная работа № 2 «Моделирование случайных величин для эконометрического моделирования. Проверки гипотез о виде распределения»
- •Решение типового примера
- •Решение типового примера
- •Лабораторная работа № 4 «Обнаружение гетероскедастичности. Метод взвешенных наименьших квадратов. Коррекция моделей на гетероскедастичность»
- •Решение типового примера
- •Лабораторная работа № 5 «Нелинейная регрессия. Спецификация модели. Оценка качества нелинейной модели»
- •Лабораторная работа № 6 «Экстраполяция тенденций и динамики развития финансово-экономических показателей»
- •Решение типового примера
- •Лабораторная работа № 7 «Анализ сезонной составляющей временного ряда с использованием Фурье спектрального анализа»
- •Лабораторная работа № 8 «Прогнозирование временного ряда на основе адаптивных моделей»
- •Решение типового примера
- •Лабораторная работа № 9 «Прогнозирование временного ряда на основе arma-моделей»
- •Решение типового примера
- •Рекомендуемый список литературы для выполнения практических работ
- •Приложение а Функция Лапласа (стандартизированное нормальное распределение)
- •Приложение б Распределение Стьюдента (t - распределение)
- •Приложение в
- •Приложение г Распределение Фишера (f – распределение)
- •Приложение д
Лабораторная работа № 6 «Экстраполяция тенденций и динамики развития финансово-экономических показателей»
Задание:
Для зависимой переменной Y(t) построить линейную модель, параметры модели оценить с помощью метода наименьших квадратов. Оценить качество построенной модели (провести исследования адекватности и точности модели).
№ варианта |
Значения Y(t) при t |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
1 |
10 |
14 |
21 |
24 |
33 |
41 |
44 |
47 |
49 |
2 |
43 |
47 |
50 |
48 |
54 |
57 |
61 |
59 |
65 |
3 |
3 |
7 |
10 |
11 |
15 |
17 |
21 |
25 |
23 |
4 |
30 |
28 |
33 |
37 |
40 |
42 |
44 |
49 |
47 |
5 |
8 |
12 |
13 |
15 |
21 |
22 |
27 |
29 |
33 |
6 |
21 |
26 |
28 |
32 |
35 |
36 |
39 |
44 |
43 |
7 |
2 |
5 |
6 |
9 |
8 |
12 |
14 |
15 |
19 |
8 |
14 |
19 |
17 |
20 |
22 |
26 |
29 |
30 |
31 |
9 |
35 |
36 |
39 |
40 |
41 |
45 |
44 |
46 |
48 |
10 |
23 |
25 |
28 |
27 |
32 |
33 |
36 |
37 |
39 |
Решение типового примера
Даны следующие данные:
Значения Y(t) при t |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
25 |
34 |
42 |
51 |
55 |
67 |
73 |
76 |
81 |
Для отражения тенденции изменения исследуемого показателя воспользуемся простейшей моделью вида:
Yp(t) = a0 + a1 t (t = 1,2,...,N).
Параметры кривой роста оцениваются по методу наименьших квадратов (МНК).
Для линейной модели:
a1 = ∑ [(t - tср) (Y(t) - Yср)] : ∑ (t - tср)2 ,
a0 = Yср - a1 tср,
tср - среднее значение фактора времени;
Yср - среднее значение исследуемого показателя.
Примечание:
В Excel математическое ожидание (среднее значение) определяется с помощью функции СРЗНАЧ (значения чисел) в категории Статистические.
Среднее квадратическое отклонение, обозначаемое σ(x), определяет разброс значений случайной величины относительно ее математического ожидания. Заметим, что в Excel эта величина называется стандартное отклонение - СТАНДОТКЛОН (значения чисел) по зависимости.
По данным о курсе акций за девять недель построим линейную модель.
Таблица 6.1 – Оценка параметров уравнения прямой
t |
Факт Y(t) |
t - tср |
(t - tср)2 |
Yt - Ycp |
(t - tср) * (Yt - Ycp) |
Расчет Yp(t) |
Отклонение E(t) |
1,00 |
25 |
-4,00 |
16,00 |
-31,00 |
124,00 |
27,47 |
-2,47 |
2,00 |
34 |
-3,00 |
9,00 |
-22,00 |
66,00 |
34,60 |
-0,60 |
3,00 |
42 |
-2,00 |
4,00 |
-14,00 |
28,00 |
41,73 |
0,27 |
4,00 |
51 |
-1,00 |
1,00 |
-5,00 |
5,00 |
48,87 |
2,13 |
5,00 |
55 |
0,00 |
0,00 |
-1,00 |
0,00 |
56,00 |
-1,00 |
6,00 |
67 |
1,00 |
1,00 |
11,00 |
11,00 |
63,13 |
3,87 |
7,00 |
73 |
2,00 |
4,00 |
17,00 |
34,00 |
70,27 |
2,73 |
8,00 |
76 |
3,00 |
9,00 |
20,00 |
60,00 |
77,40 |
-1,40 |
9,00 |
81 |
4,00 |
16,00 |
25,00 |
100,00 |
84,53 |
-3,53 |
45,00 |
504,00 |
0,00 |
60,00 |
0,00 |
428,00 |
504,00 |
0,00 |
Ycp = 56; tcp = 5
a1 = 7,13
a0 = 20,33
Таким образом линейная модель имеет вид:
Yp(t) = 20,33 + 7,13t (t = 1,2,...,9).
Отклонения расчетных значений от фактических наблюдений вычисляются как
E(t) = Y(t) – Yp(t) , t = 1,2,...,9.
Необходимо оценить качество модели, исследовав ее адекватность и точность.
Качество модели определяется ее адекватностью исследуемому процессу, которая характеризуется выполнением определенных статистических свойств, и точностью, т.е. степенью близости к фактическим данным. Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна.
Модель является адекватной, если ряд остатков обладает свойствами случайности, независимости последовательных уровней, нормальности распределения и равенства нулю средней ошибки.
Результаты исследования адекватности отражены в таблице 6.2.
Таблица 6.2 – Оценка адекватности модели
t |
Отклонение E(t) |
Точки поворота |
E(t)2 |
E(t)-E(t+1) |
[E(t)-E(t+1)]^2 |
E(t)* E(t+1) |
|E(t)|:Y(t)* 100 |
1,00 |
-2,47 |
- |
6,08 |
-1,87 |
3,48 |
1,48 |
9,87 |
2,00 |
-0,60 |
0 |
0,36 |
-0,87 |
0,75 |
-0,16 |
1,76 |
3,00 |
0,27 |
0 |
0,07 |
-1,87 |
3,48 |
0,57 |
0,63 |
4,00 |
2,13 |
1 |
4,55 |
3,13 |
9,82 |
-2,13 |
4,18 |
5,00 |
-1,00 |
1 |
1,00 |
-4,87 |
23,68 |
-3,87 |
1,82 |
6,00 |
3,87 |
1 |
14,95 |
1,13 |
1,28 |
10,57 |
5,77 |
7,00 |
2,73 |
0 |
7,47 |
4,13 |
17,08 |
-3,83 |
3,74 |
8,00 |
-1,40 |
0 |
1,96 |
2,13 |
4,55 |
4,95 |
1,84 |
9,00 |
-3,53 |
- |
12,48 |
- |
- |
- |
4,36 |
45,00 |
0,00 |
3,00 |
48,93 |
- |
64,14 |
7,58 |
33,99 |
Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек. В соответствии с ним каждый уровень ряда сравнивается с двумя рядом стоящими. Если он больше или меньше их, то эта точка считается поворотной. Далее подсчитывается сумма поворотных точек «р». В случайном ряду чисел должно выполняться строгое неравенство:
Квадратные скобки здесь означают, что от результата вычислений берется целая часть числа ( не путать с процедурой округления!). При N = 9 в правой части неравенства имеем: [2,41] = 2. Следовательно, свойство случайности выполняется.
При проверке независимости (отсутствия автокорреляции) определяется отсутствие в ряду остатков систематической составляющей. Это проверяется с помощью d-критерия Дарбина - Уотсона, в соответствии с которым определяется коэффициент d:
Вычисленная величина этого критерия сравнивается с двумя табличными уровнями: нижним d1 = 1,08 и верхним d2 = 1,36.
d = 1,31, т.к. d1 < d < d2 - то однозначного вывода сделать нельзя и необходимо применение других критериев, например, первого коэффициента автокорреляции r(1), который вычисляется по формуле:
Если r(1) > r (табл.) (при N < 15 r(табл) = 0,36), то присутствие в остаточном ряду существенной автокорреляции подтверждается.
r(1) = 0,15.
Следовательно, по этому критерию также подтверждается выполнение свойства независимости уровней остаточной компоненты.
Соответствие ряда остатков нормальному закону распределения определим при помощи RS-критерия:
RS = (Emax – Emin) : S,
где Emax – максимальный уровень ряда остатков;
Emin – минимальный уровень ряда остатков;
S – среднее квадратическое отклонение.
Если значение этого критерия попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении ряда остатков принимается. Для N = 10 и 5%-го уровня значимости этот интервал равен (2,7 – 3,7).
В нашем примере: Emax = 3,87 и Emin = –3,53.
=
2,47.
RS = 2,99.
Расчетное значение попадает в интервал. Следовательно, свойство нормальности распределения выполняется, что позволяет строить доверительный интервал прогноза.
Для характеристики точности воспользуемся среднеквадратическим отклонением и средней относительной ошибкой:
=3,78
Ее величина не более 5% свидетельствует о достаточном уровне точности модели (ошибка в 10 и более процентов является очень большой).
Точечный прогноз на k шагов вперед получается путем подстановки в модель параметра t= N+1, ..., N+k. При прогнозировании на два шага имеем:
Yp(10) = 20,33 + 7,13 * 10 = 91,67 (k = 1, t = 10),
Yp(11) = 20,33 + 7,13 * 11 = 98,80 (k = 2, t = 11).
Доверительный интервал прогноза будет иметь следующие границы:
Верхняя граница прогноза = Yp(N + k) + U(k),
Нижняя граница прогноза = Yp(N + k) – U(k).
Величина U(k) для линейной модели имеет вид:
.
Коэффициент Kp является табличным значением t-статистики Стьюдента. Если исследователь задает уровень вероятности попадания прогнозируемой величины внутрь доверительного интервала, равный 70%, то Kp = 1,05.
U(1) = 3,21.
U(2) = 3,40.
Таблица 6.3 – Прогнозные оценки по линейной модели
Время t |
Шаг k |
Прогноз Yp(t) |
Нижняя граница |
Верхняя граница |
10,00 |
1,00 |
91,67 |
88,46 |
94,88 |
11,00 |
2,00 |
98,80 |
95,40 |
102,20 |
Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадет в интервал, образованный нижней и верхней границами. В нашем случае такое утверждение правомерно из-за полной адекватности модели.
На рисунке 6.1 представлены результаты аппроксимации и прогнозирования по линейной модели.
Рисунок 6.1 – Результаты аппроксимации и прогнозирования по линейной модели
