
Индивидуальное задание №4
Задан динамический ряд числа проданных телевизоров
Месяц |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
Продажа |
46 |
56 |
54 |
43 |
57 |
56 |
67 |
62 |
50 |
56 |
47 |
56 |
54 |
42 |
64 |
60 |
70 |
66 |
57 |
55 |
53 |
62 |
70 |
72 |
Требуется:
провести предварительный анализ данных;
с помощью функций - кандидатов провести формирование набора моделей;
найти численные значения параметров моделей на основании метода наименьших квадратов;
определить адекватность моделей
оценить точность адекватных моделей;
выбрать наилучшую модель;
получить точечный и интервальный прогнозы на следующие два месяца;
провести верификацию полученных прогнозов.
Решение.
1. Проведем
сглаживание заданного динамического
ряда с помощью метода экспоненциального
сглаживания, приняв величину сглаживания
=0,1.
Построим полученную сглаженную линию
регрессии.
месяц |
продажа |
Сглаж. Значение |
|
|
|
||||||
1 |
46 |
- |
|
|
|
|
|
|
0,1 |
|
|
2 |
56 |
46 |
|
|
|
|
|
|
|
|
|
3 |
54 |
47 |
|
|
|
|
|
|
|
|
|
4 |
43 |
47,7 |
|
|
|
|
|
|
|
|
|
5 |
57 |
47,23 |
|
|
|
|
|
|
|
|
|
6 |
56 |
48,207 |
|
|
|
|
|
|
|
|
|
7 |
67 |
48,9863 |
|
|
|
|
|
|
|
|
|
8 |
62 |
50,78767 |
|
|
|
|
|
|
|
|
|
9 |
50 |
51,9089 |
|
|
|
|
|
|
|
|
|
10 |
56 |
51,71801 |
|
|
|
|
|
|
|
|
|
11 |
47 |
52,14621 |
|
|
|
|
|
|
|
|
|
12 |
56 |
51,63159 |
|
|
|
|
|
|
|
|
|
13 |
54 |
52,06843 |
|
|
|
|
|
|
|
|
|
14 |
42 |
52,26159 |
|
|
|
|
|
|
|
|
|
15 |
64 |
51,23543 |
|
|
|
|
|
|
|
|
|
16 |
60 |
52,51189 |
|
|
|
|
|
|
|
|
|
17 |
70 |
53,2607 |
|
|
|
|
|
|
|
|
|
18 |
66 |
54,93463 |
|
|
|
|
|
|
|
|
|
19 |
57 |
56,04117 |
|
|
|
|
|
|
|
|
|
20 |
55 |
56,13705 |
|
|
|
|
|
|
|
|
|
21 |
53 |
56,02334 |
|
|
|
|
|
|
|
|
|
22 |
62 |
55,72101 |
|
|
|
|
|
|
|
|
|
23 |
70 |
56,34891 |
|
|
|
|
|
|
|
|
|
24 |
72 |
57,71402 |
|
|
|
|
|
|
|
|
|
25 |
57,71402 |
59,14262 |
|
|
|
|
|
|
|
|
Из графика видно, что временной ряд экономического показателя имеет тренд, т.е. преобладающую тенденцию изменения. Предполагая, что общие условия, определявшие развитие показателя в прошлом, останутся без существенных изменений в течение периода упреждения, найдем кривые роста, для моделирования и прогнозирования продаж телевизоров.
2. В качестве тренда для заданного временного ряда можно принять следующие модели: а) линейную модель
;
б) экспоненциальную модель
в) логарифмическую модель
.
Для заданного временного ряда уравнения трендов имеют соответственно вид:
а) линейная модель
;
Предположение о линейности тренда подтверждают рассчитанные первые приросты или цепные приращения, которые являются практически постоянными величинами.
б) экспоненциальную модель
в) логарифмическую модель
.
3. Численные значения параметров модели можно рассчитать на основании метода наименьших квадратов. Для этого рассматриваемую модель нужно свести к линейной, а затем, решая систему нормальных уравнений, определить неизвестные коэффициенты.
4. Оценим точность полученной трендовой модели.
Линейная модель
t |
Фактическое
|
Расчетное
|
Отклонение
|
Точки пиков |
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
42 |
46,716 |
-4,716 |
- |
22,244 |
- |
|
11,230 |
2 |
54 |
47,203 |
6,797 |
1 |
46,202 |
11,514 |
132,563 |
12,587 |
3 |
57 |
47,689 |
9,311 |
1 |
86,691 |
2,514 |
6,318 |
16,335 |
4 |
40 |
48,176 |
-8,176 |
1 |
66,840 |
-17,486 |
305,774 |
20,439 |
5 |
59 |
48,662 |
10,338 |
1 |
106,87 |
18,514 |
342,753 |
17,522 |
6 |
56 |
49,148 |
6,852 |
1 |
46,944 |
-3,486 |
12,155 |
12,235 |
7 |
67 |
49,635 |
17,365 |
1 |
301,55 |
10,514 |
110,536 |
25,918 |
8 |
62 |
50,121 |
11,879 |
0 |
141,106 |
-5,486 |
30,101 |
19,159 |
9 |
50 |
50,608 |
-0,608 |
1 |
0,369 |
-12,486 |
155,910 |
1,215 |
10 |
56 |
51,094 |
4,906 |
1 |
24,069 |
5,514 |
30,400 |
8,761 |
11 |
47 |
51,580 |
-4,580 |
1 |
20,980 |
-9,486 |
89,992 |
9,746 |
12 |
56 |
52,067 |
3,933 |
1 |
15,470 |
8,514 |
72,481 |
7,024 |
13 |
54 |
52,553 |
1,447 |
0 |
2,093 |
-2,486 |
6,182 |
2,679 |
14 |
42 |
53,040 |
-11,040 |
1 |
121,873 |
-12,486 |
155,910 |
26,285 |
15 |
64 |
53,526 |
10,474 |
1 |
109,705 |
21,514 |
462,835 |
16,366 |
16 |
60 |
54,012 |
5,988 |
1 |
35,851 |
-4,486 |
20,128 |
9,979 |
17 |
70 |
54,499 |
15,501 |
1 |
240,287 |
9,514 |
90,509 |
22,145 |
18 |
66 |
54,985 |
11,015 |
0 |
121,326 |
-4,486 |
20,128 |
16,689 |
19 |
57 |
55,472 |
1,528 |
0 |
2,336 |
-9,486 |
89,992 |
2,681 |
20 |
55 |
55,958 |
-0,958 |
0 |
0,918 |
-2,486 |
6,182 |
1,742 |
21 |
53 |
56,444 |
-3,444 |
1 |
11,864 |
-2,486 |
6,182 |
6,499 |
22 |
62 |
56,931 |
5,069 |
0 |
25,697 |
8,514 |
72,481 |
8,176 |
23 |
70 |
57,417 |
12,583 |
0 |
158,327 |
7,514 |
56,454 |
17,975 |
24 |
72 |
57,904 |
14,096 |
- |
198,708 |
1,514 |
2,291 |
19,578 |
300 |
1371 |
1255,440 |
115,560 |
15 |
1908,32 |
|
2278,257 |
312,965 |
Для этого всего сформируем остаточную последовательность (ряд остатков), для чего из фактических значений уровней ряда вычтем соответствующие расчетные значения по модели: остаточная последовательность приведена в гр. 4 таблицы.
Проверку случайности уровней ряда остатков проведем на основе критерия пиков (поворотных точек).
Уровень
последовательности
считается максимумом, если
он больше двух рядом стоящих уровней,
т.е.
,
и минимумом, если он меньше обоих соседних уровней, т.е.
.
Точки максимума и минимума последовательности называются поворотными точками.
Общее число
поворотных точек для остаточной
последовательности
обозначим через
.
В случайной выборке
математическое ожидание числа точек
поворота
и дисперсия
выражаются формулами:
,
Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства
,
где квадратные скобки означают целую часть числа. Если это неравенство не выполняется, трендовая модель считается неадекватной.
Точки пиков отмечены в гр. 5 таблицы; их количество равно = 15. Находим для заданного случая математическое ожидание числа точек поворота и дисперсию
,
.
Для рассматриваемой модели выполняется неравенство
.
Вывод: с доверительной вероятностью 95%, можно утверждать, что линейная трендовая модель является адекватной, т.к. свойство случайности ряда остатков подтверждается.
Проверка
соответствия распределения случайной
компоненты нормальному закону
распределения. Для этого воспользуемся
-критерием,
в основе которого критерия лежит
исследование отношения размаха вариации
случайной величины
к стандартному отклонению
.
Эти величины определяются следующим
образом
,
.
Вычисленное
значение
критерия сравнивается с табличными
(критическими) нижней и верхней границами
данного отношения, и если это значение
не попадает в интервал между критическими
границами, то с заданным уровнем
значимости гипотеза о нормальности
распределения отвергается; в противном
случае эта гипотеза принимается. Для
иллюстрации приведем несколько пар
значений критических границ
-критерия
для уровня значимости
= 0,05.
|
|
|
10 |
2,67 |
3,685 |
20 |
3,18 |
4,49 |
30 |
3,47 |
4,89 |
В нашем случае размах вариации
=
а среднее квадратическое отклонение
=
.
Сравнивая значение
=
с табличными (критическими) значениями
нижней и верхней границ данного отношения,
видим, что значение попадает в интервал
между нижней и верхней границами
табличных значений данного критерия.
Эти границы для
= 20 и уровня значимости
= 0,05 составляют соответственно 3,18 и
4,49. Это позволяет сделать следующий
вывод.
Вывод: свойство нормальности распределения выполняется.
в) Проверка
равенства математического ожидания
случайной компоненты нулю, если
она распределена по нормальному
закону, осуществляется на основе
-критерия
Стьюдента.
Расчетное значение этого критерия задается формулой
,
где
— среднее арифметическое значение
уровней остаточной последовательности
;
— стандартное
(среднеквадратическое) отклонение для
этой последовательности.
Если расчетное
значение
меньше табличного значения
статистики Стьюдента с заданным
уровнем значимости
и числом степеней свободы
,
то гипотеза о равенстве нулю математического
ожидания случайной последовательности
принимается; в противном случае эта
гипотеза отвергается и модель считается
неадекватной.
Переходя к проверке равенства (близости) нулю математического ожидания ряда остатков для рассматриваемой модели, находим по результатам вычислений, приведенных в таблице,
=
,
=
7,505287,
=3,142929.
Вывод: Т.к.
расчетное значение
=3,142929
меньше табличного значения
статистики Стьюдента с заданным
уровнем значимости
= 0,05 и числом степеней свободы
=
24-1=23, то гипотеза о равенстве нулю
математического ожидания случайной
последовательности принимается.
г) Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является d-критерий Дарбина—Уотсона.
Расчетное значение этого критерия определяется по формуле
.
Заметим, что
расчетное значение критерия Дарбина-Уотсона
в интервале от 2 до 4 свидетельствует об
отрицательной связи; в этом случае его
надо преобразовать по формуле
и
в дальнейшем использовать значение
.
Расчетное значение
критерия
(или
)
сравнивается с верхним
и нижним
критическими значениями статистики
Дарбина—Уотсона, фрагмент табличных
значений которых для различного числа
уровней ряда
и числа определяемых параметров
модели
представлен в табл. (уровень значимости
5%).
|
|
|
|
|||
|
|
|
|
|
|
|
15 |
1,08 |
1,36 |
0,95 |
1,54 |
0,82 |
1,75 |
20 |
1,20 |
1,41 |
1,10 |
1,54 |
1,00 |
1,68 |
30 |
1,35 |
1,49 |
1,28 |
1,57 |
1,21 |
1,65 |
Если расчетное значение критерия больше верхнего табличного значения , то гипотеза о независимости уровней остаточной последовательности, т.е. об отсутствии в ней автокорреляции, принимается. Если значение меньше нижнего табличного значения , то эта гипотеза отвергается и модель неадекватна. Если значение находится между значениями и включая сами эти значения, то считается, что нет достаточных оснований сделать тот или иной вывод и необходимы дальнейшие исследования, например, по большему числу наблюдений.
Для рассматриваемой модели находим
=1,193852.
Т.к. найденное
значение
удовлетворяет неравенству
,
то это свидетельствует об отрицательной
связи; в этом случае его надо преобразовать
по формуле
и в дальнейшем использовать значение . Расчетное значение критерия сравниваем с верхним и нижним критическими значениями статистики Дарбина—Уотсона, фрагмент табличных значений которых для различного числа уровней ряда и числа определяемых параметров модели представлен в табл. (уровень значимости 5%).
Вывод об адекватности трендовой модели делается, если все указанные выше четыре проверки свойств остаточной последовательности дают положительный результат.