
- •1. Предмет и метод исследования
- •1.1. Некоторые сведения из математической статистики
- •1.2. Распределение оценок для малых выборок
- •1.3. Методы оценивания параметров
- •1.4. Спецификация моделей регрессии
- •1.5. Вопросы для обсуждения
- •2. Линейные однофакторные модели регрессии
- •2.1. Свойства коэффициентов парной корреляции
- •2.2. Метод наименьших квадратов
- •2.3. Предпосылки мнк
- •2.4. Линейная модель парной регрессии
- •2.5. Оценка значимости параметров и качества модели
- •2.6. Точечный и интервальный прогноз
- •2.7. Вопросы для обсуждения
- •3. Нелинейные однофакторные модели регрессии
- •3.1. Методы линеаризации
- •3.2. Оценка тесноты связи и качества нелинейной модели
- •3.3. Обобщенный метод наименьших квадратов
- •4. Многофакторные модели регрессии
- •4.1. Мнк для расчета параметров двухфакторной модели
- •4.2. Оценка тесноты связи в многофакторной модели
- •4.3. Оценка качества модели
- •4.4. Принципы отбора факторов модели
- •4.5. Анализ мультиколлинеарности в нелинейных моделях
- •4.6. Вопросы для обсуждения
- •5. Динамические ряды
- •5.1. Выявление аномальных наблюдений
- •5.2. Сглаживание временного ряда
- •5.3. Аппроксимация сезонных колебаний
- •5.4. Корреляционная зависимость уровней ряда
- •5.5. Оценка адекватности модели. Проверка предпосылок мнк
- •2.2) Критерий поворотных точек.
- •5.6. Точечный и интервальный прогноз
- •5.7. Вопросы для обсуждения
- •6. Адаптивные модели прогнозирования
- •6.1. Линейная модель Брауна
- •6.2. Модель Хольта-Уинтерса
- •7. Эконометрические исследования динамического ряда
- •8. Эконометрические исследования статистического ряда
- •1. Найти параметры уравнения линейной регрессии, дать экономическую оценку коэффициента регрессии.
- •2. Вычислить остатки, найти остаточную сумму квадратов, оценить дисперсию остатков, построить график остатков.
- •3. Проверить выполнение предпосылок мнк (оценить адекватность модели).
- •4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента ( ).
- •5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью f-критерия Фишера ( ), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
- •6. Осуществить прогнозирование среднего значения показателя y при уровне значимости , если прогнозное значение фактора X составит 80% от его максимально значения.
- •7. Представить графически: фактические и модельные значения y, точки прогноза.
- •8. Составить уравнения гиперболической (а), степенной (б), показательной (в) регрессий и построить их графики.
- •9. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод об их качестве.
- •9. Приложения
- •10. Тесты по эконометрике
- •11. Тест-глоссарий
- •12. Ключевые вопросы
- •Литература
- •Оглавление
- •1. Предмет и метод исследования…………………………..…
- •8. Эконометрические исследования статистического ряда
5.5. Оценка адекватности модели. Проверка предпосылок мнк
Если уровни ряда выявлены верно, т.е. в соответствие с экономическим смыслом задачи, то остатки должны удовлетворять требованиям МНК. Оценка адекватности модели базируется на проверке выполнения предпосылок МНК (были сформулированы ранее).
1)
Проверка выполнения условия
проводится на основе нулевой гипотезы
.
Строится t-статистика
где
– среднее арифметическое,
.
Гипотеза принимается, если
–
критерий Стьюдента с уровнем значимости
α
и количеством степеней свободы
.
2) Проверка случайности ряда остатков может быть проведена разными способами.
2.1)
Критерий
серий.
Расположим величины
в порядке возрастания и найдем медиану
,
т.е. срединное значение при нечетном n
и среднее
арифметическое двух срединных значений
– при четном n.
Далее будем строить серии, т.е.
последовательности из ряда остатков
подряд расположенных членов, для которых
имеют один и тот же знак. Если модель
правильно отражает исследуемую
зависимость, то она часто пересекает
ломаную линию исходных данных и тогда
серий много, а их длина невелика.
Сравнивая
исходную последовательность с медианой,
будем ставить знак +, если
и знак –, если
Если
,
то
не учитывается. В результате получим
последовательность плюсов и минусов,
с общим числом, не превосходящим n
членов ряда. Для того чтобы последовательность
была случайной требуется, чтобы
протяженность самой длинной серии была
не слишком большой, а общее число серий
наоборот – большим.
Пусть
протяженность самой длинной серии
а общее число серий
.
Последовательность остатков признается
случайной, если:
а)
– протяженность самой длинной серии;
б)
,
где
– целая часть числа,
– общее число серий. Если хотя бы одно
из двух требований не выполняется, то
гипотеза о случайности остатков
отвергается и, следовательно, подтверждается
наличие зависящей от времени неслучайной
компоненты в разложении модели
2.2) Критерий поворотных точек.
Рассматриваем
ряд остатков. Считаем точку
поворотной точкой
и присваиваем ей
значение 1, если
или
.
В противном случае точка
не считается поворотной и ей присваивается
значение 0.
Свойство случайности с уровнем значимости 0,05 выполняется, если фактическое количество поворотных точек больше расчетного (целого):
.
3) Отсутствие автокорреляции проверяется с помощью критерия Дарбина-Уотсона (Д-У). Рассчитывается величина
Допустим,
что средний уровень остатков равен
нулю, т.е.
,
тогда
(первый коэффициент автокорреляции).
Если допустить, что
(чем больше объем выборки, тем точнее
это соотношение), то
Отсюда
видно, что если
,
т.е. автокорреляция остатков отсутствует,
то
.
При полной автокорреляции
равно 0, если
или 4, если
.
Обратимся
к основной формуле. Если
,
то теоретически присутствует положительная
автокорреляция, если
,
то имеет место отрицательная связь. В
этом случае переходят к анализу величины
и в дальнейшем используется
.
Расчетное значение критерия
(или
)
сравнивается с табличными: нижним
и верхним
критическими значениями статистики
Д-У. Анализ наличия/отсутствия
автокорреляции можно проводить и
непосредственно.
Если
окажется
то принимается положительная
автокорреляция, а модель признается
неадекватной.
Если
окажется
то автокорреляция отвергается.
Если
окажется
или
,
то ничего определенного о автокорреляции
остатков сказать нельзя и требуются
дальнейшие исследования, например,
вычисление коэффициента корреляции
первого порядка, увеличение числа
наблюдений, уточнение уравнения тренда
и др.
Если
окажется
то принимается отрицательная
автокорреляция, а модель признается
неадекватной.
Пример.
Пусть вычисленный коэффициент
автокорреляции первого порядка есть
.
Для заданного количества параметров
при факторных признаках и известном
количестве наблюдений известны
критические значения
и
,
которые разбивают отрезок
на пять частей. Вычислим величину
.
Проведем анализ.
На
отрезке
– положительная автокорреляция.
На
отрезке
– область неопределенности.
На отрезке – нет автокорреляции.
На отрезке – область неопределенности.
На отрезке – отрицательная автокорреляция.
Поскольку,
в нашем случае
,
то можно сделать вывод о том, что
автокорреляция отсутствует.
Если
между уровнями ряда обнаружена
автокорреляция, то каждый уровень
можно рассматривать как функцию
предыдущих значений уровней. Уравнение,
определяющее такую зависимость,
называется уравнением авторегрессии.
Самый простой вид такой зависимости
выражает линейная функция
.
Отсутствие автокорреляции обеспечивает эффективность и состоятельность оценок коэффициентов модели.
4) Соответствие распределения остатков закону Гаусса проверяется с помощью R/S-критерия
Если расчетное значение R/S попадает между табулированными, то гипотеза о нормальном распределении остатков принимается. Для числа наблюдений
для n =10 => R/S = 2.67 … 3.685
для n =20 => R/S = 3,18 … 4,49
для n =30 => R/S = 3,47 … 4,89
при уровне значимости 0,05, то H0 – гипотеза о ненормальном распределении отвергается и принимается H1 – гипотеза о нормальном распределении .
Модель признается адекватной, если выполнены все требования, предъявляемые к остаткам. Описанная выше техника оценки параметров модели и уравнения в целом без изменений переносится и на временные ряды, в частности, если коэффициент детерминации существенно отличен от нуля, то это означает неравенство нулю коэффициентов регрессии и трендовую компоненту можно использовать для прогноза.