- •Предисловие
- •Введение
- •Пример 1.
- •Пример 2.
- •Глава 1. Анализ данных
- •§1. Состав исходной информации
- •§2. Интерполяционный полином Лагранжа
- •Случай 1.
- •Случай 2.
- •Случай 3.
- •Случай n.
- •§3. Парная линейная регрессия. Метод наименьших квадратов
- •§4. Множественная линейная регрессия
- •§5. Нелинейные модели
- •§6. Системы одновременных эконометрических уравнений
- •Глава 2. Временные ряды §7. Составляющие временного ряда
- •§8. Определение составляющих временного ряда
- •При этом коэффициенты ak, bk будут равны
- •§9. Временной ряд как случайный процесс
- •§10. Модели arima
- •§11. Учет сезонных составляющих
- •Глава 3. Оценка качества спецификации модели §12. Анализ погрешностей исходной информации
- •§13. Доверительные интервалы
- •§14. Расчет погрешностей
- •§15. Коэффициент детерминации
- •§16. Средняя ошибка аппроксимации
- •§17. Принцип максимального правдоподобия. Построение регрессионных моделей при гетероскедастичности ошибок
- •§18. Статистические гипотезы
- •Список литературы
- •Оглавление
§11. Учет сезонных составляющих
Обобщение модели ARIMA, позволяющие учесть периодические (сезонные) составляющие временного ряда было предложено Дж. Боксом и Г. Дженкинсом [2]. Этот метод реализован в системе статистической обработки данных STATISTICA, поэтому мы коротко его опишем.
Пусть ряд xt имеет период S , так, что xt = xt-s . Модель Бокса-Дженкинса имеет вид
A(QS) DS xt = B(QS)ζt (11.1)
a(Q) d xt = b(Q)t , (11.2)
где QSxt = xt-s , S xt = xt - xt-s = (1- QS )xt ,
A(Q)= 1+A1 Q+A2 Q2+…AM QM
B(Q)= 1+B1 Q+B2 Q2+…BN QN
Из формул (11.1), (11.2) видно, что модели характеризуются двумя тройками чисел (M,D,N) и (m,d,n). Ряд ζt введен для удобства, в принципе его можно исключить. Например, пусть M = m = 0, N = n = 1, D = d = 1, S = 12. Модель (11.1), (11.2) примет вид
12xt= ζt+B1ζt-12
ζt = t+b1t-1 (11.3)
Но 12 xt = xt-xt-12, ζt = ζt-ζt-1 Поэтому
xt-xt-12 = ζt+B1ζt-12 (11.4)
xt-1-xt-13 = ζt-1+B1ζt-13 (11.5)
Теперь вычтем (11.5) из равенства (11.4):
xt-xt-12- xt-1+xt-13 = ζt- ζt-1 +B1(ζt-12- ζt-13).
Используя формулу (11.3), получим окончательно
xt-xt-12- xt-1+xt-13 = t +b1t-1+ B1(t-12+ b1 t-13).
Коэффициенты b1, B1 можно подобрать по данным xt . В примере, приведенном в книге [2], оказалось, что b1 = -0,4; B1 = - 0,6.
Глава 3. Оценка качества спецификации модели §12. Анализ погрешностей исходной информации
Значения экономических показателей обычно известны неточно, с некоторой погрешностью. Рассмотрим основные правила обработки данных, содержащих погрешности, или ошибки измерений. Пусть число a представляет точное (неизвестное нам) значение некоторой величины, а xi (i=1,2,…,n) – известные приближенные значения той же величины, при этом
xi=a+ i , (12.1)
где i – погрешность i-го измерения. Значения погрешностей i нам неизвестны, т.к. неизвестно точное значение a, но, как правило, удается оценить модуль разности
| xi –a|< . (12.2)
Величину
>
0
называют предельной
абсолютной погрешностью,
или короче, абсолютной
погрешностью.
Если a≠0
, то можно ввести относительную
погрешность
δ=
/|a|.
На практике величину относительной
погрешности вычисляют по формуле δ
= /|
|,
полагая
.
(12.3)
Принято использовать запись a=x как условную запись неравенства
x-<a<x+ (12.4)
и запись a=x(1δ) как сокращенную запись неравенств
x(1-δ)<a<x(1+δ) . (12.5)
Величина относительной погрешности δ связана с числом верных десятичных знаков числа x. Рассмотрим этот вопрос на простых примерах. Число a=51.00.5 имеет два верных десятичных знака. Поэтому относительная погрешность δ=0.5/51≈0.01 или 1%. Число b=0.510.005 также имеет два верных знака и ту же относительную погрешность δ=1%. Если число задается с тремя верными знаками, то относительная погрешность будет иметь порядок 0.1%. Например, если a=5100.5, то δ=0.001 или 0.1%. Рассматривая в качестве примеров числа 110 и 910 (с тремя верными знаками), нетрудно проверить, что относительная погрешность δ этих величин будет меняться в пределе от 0.05% до 0.5%. При двух верных десятичных знаках относительная погрешность изменяется в диапазоне 0.5% 5%.
Различают погрешности (ошибки) систематические и случайные. Если часы спешат или отстают, то они показывают время с некоторой систематической ошибкой. Для ее устранения нужно узнать точное время и выставить часы правильно. В общем случае для устранения систематической ошибки либо заменяют измерительный прибор на более точный, либо вводят поправку на систематическую ошибку (в астрономии, навигации и т.п.).
Анализ случайных ошибок проводится с применением методов теории вероятности и математической статистики. Пусть величина i в равенстве (12.1) является случайной величиной, распределенной по нормальному закону с математическим ожиданием E i=0 и дисперсией D i = 2, что принято записывать как iN(0, 2).
Измеренные
значения xi
также являются случайными величинами,
при этом Exi=a,
Dxi=
2.
Интуиция подсказывает нам, что среднее
арифметическое (12.3) является лучшей
оценкой для величины a,
чем
отдельные
наблюдения xi
.
Действительно,
оценка является несмещенной, а
дисперсия среднего
приn∞
стремится к нулю. Величину дисперсии
измерений
2
можно оценить по данным xi
известными формулами
(12.5)
или
(12.6)
При
этом оценка (12.5) является смещенной
оценкой дисперсии
2,
так как известно [3], что
.
Оценка (12.6) несмещенная:
.
В теории ошибок величина
называют средней квадратичной ошибкой
серии наблюдений {xi},
а величина
средней квадратичной ошибкой среднего
арифметического.
