
- •1. Предмет и метод исследования
- •1.1. Некоторые сведения из математической статистики
- •1.2. Распределение оценок для малых выборок
- •1.3. Методы оценивания параметров
- •1.4. Спецификация моделей регрессии
- •1.5. Вопросы для обсуждения
- •2. Линейные однофакторные модели регрессии
- •2.1. Свойства коэффициентов парной корреляции
- •2.2. Метод наименьших квадратов
- •2.3. Предпосылки мнк
- •2.4. Линейная модель парной регрессии
- •2.5. Оценка значимости параметров и качества модели
- •2.6. Точечный и интервальный прогноз
- •2.7. Вопросы для обсуждения
- •3. Нелинейные однофакторные модели регрессии
- •3.1. Методы линеаризации
- •3.2. Оценка тесноты связи и качества нелинейной модели
- •3.3. Обобщенный метод наименьших квадратов
- •4. Многофакторные модели регрессии
- •4.1. Мнк для расчета параметров двухфакторной модели
- •4.2. Оценка тесноты связи в многофакторной модели
- •4.3. Оценка качества модели
- •4.4. Принципы отбора факторов модели
- •4.5. Анализ мультиколлинеарности в нелинейных моделях
- •4.6. Вопросы для обсуждения
- •5. Динамические ряды
- •5.1. Выявление аномальных наблюдений
- •5.2. Сглаживание временного ряда
- •5.3. Аппроксимация сезонных колебаний
- •5.4. Корреляционная зависимость уровней ряда
- •5.5. Оценка адекватности модели. Проверка предпосылок мнк
- •2.2) Критерий поворотных точек.
- •5.6. Точечный и интервальный прогноз
- •5.7. Вопросы для обсуждения
- •6. Адаптивные модели прогнозирования
- •6.1. Линейная модель Брауна
- •6.2. Модель Хольта-Уинтерса
- •7. Эконометрические исследования динамического ряда
- •8. Эконометрические исследования статистического ряда
- •1. Найти параметры уравнения линейной регрессии, дать экономическую оценку коэффициента регрессии.
- •2. Вычислить остатки, найти остаточную сумму квадратов, оценить дисперсию остатков, построить график остатков.
- •3. Проверить выполнение предпосылок мнк (оценить адекватность модели).
- •4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента ( ).
- •5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью f-критерия Фишера ( ), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
- •6. Осуществить прогнозирование среднего значения показателя y при уровне значимости , если прогнозное значение фактора X составит 80% от его максимально значения.
- •7. Представить графически: фактические и модельные значения y, точки прогноза.
- •8. Составить уравнения гиперболической (а), степенной (б), показательной (в) регрессий и построить их графики.
- •9. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод об их качестве.
- •9. Приложения
- •10. Тесты по эконометрике
- •11. Тест-глоссарий
- •12. Ключевые вопросы
- •Литература
- •Оглавление
- •1. Предмет и метод исследования…………………………..…
- •8. Эконометрические исследования статистического ряда
2.5. Оценка значимости параметров и качества модели
Пусть эмпирическое
уравнение регрессии имеет вид
.
Перепишем это уравнение в виде
.
– отклонение результата i-го
наблюдения от среднего значения
независимой переменной y;
– отклонение линии
регрессии в наблюдаемой i-й
точке от среднего значения
;
– отклонение
результата i-го
наблюдения от модельного значения,
определяемого по линии регрессии в
точке xi.
Прямая
является одной из возможных, для которых
выполняется условие
.
Таким образом, коэффициент детерминации
позволяет определить в какой степени
прямая найденная по МНК дает лучший
результат для объяснения зависимой
переменной y
чем горизонтальная прямая
.
Возведем обе части переписанного уравнения регрессии в квадрат и просуммируем, тогда получим
Можно показать
(покажите), что
.
Тогда при анализе статистической модели
общую дисперсию окончательно рассматривают
как сумму объясненной и остаточной
дисперсий:
Общая сумма квадратов отклонений = сумма квадратов отклонений, объясненная регрессией + остаточная сумма квадратов отклонений.
Сумма квадратов отклонений связана с числом степеней свободы варьирования признака. Число же степеней свободы связано с объемом выборки n (величиной совокупности).
Общая сумма
квадратов интерпретируется как мера
общего разброса зависимой переменной
y
относительно
.
Для образования общей суммы квадратов
отклонений (левая часть дисперсионного
равенства) из n
возможных отклонений:
свободно варьируются только
отклонений. Поскольку все значения
связаны условием
,
то одно (любое) из n
отклонений является следствием остальных
отклонений. Таким образом, для вычисления
левой части суммы квадратов
необходимо только
отклонений (независимых вариаций). Итак,
число степеней свободы (в однофакторной
модели) общей дисперсии равно
.
Объясненная сумма квадратов интерпретируется
как мера разброса, объясненная с помощью
регрессии; она имеет только одну степень
свободы. Действительно, поскольку при
заданном наборе
,
рассчитываемое значение
,
является лишь функцией коэффициента
регрессии
в силу связи
,
то
.
Что касается количества степеней свободы
суммы квадратов случайной переменной
,
то в общем случае, мы о нем ничего сказать
не можем.
В
случае однофакторной модели линейной
регрессии имеет место теорема о равенстве
степеней свободы общей суммы квадратов
сумме квадратов факторной и остаточной
составляющих:
.
Отсюда, число степеней свободы остаточной
суммы квадратов составляет
.
Средние квадраты отклонений или дисперсии в однофакторной модели в расчете на одну степень свободы даются формулами:
Здесь и далее через S2 обозначается дисперсия в расчете на одну степень свободы, в отличие от средней по совокупности дисперсии 2.
Чем меньше остаточная дисперсия, тем меньше влияние неучитываемых в модели факторов и тем лучше модель регрессии подходит к исходным данным. Отношение факторной (объясненной) и остаточной (необъясненной) дисперсий в расчете на одну степень свободы позволяет сделать вывод о значимости (существенности) уравнения регрессии в целом. Так, если
то нулевая гипотеза об отсутствии связи признаков отклоняется и уравнение регрессии признается значимым.
Для
малых выборок
средние ошибки случайных отклонений
даются формулами:
Надежность оценок коэффициента корреляции и коэффициентов и в модели линейной регрессии зависит от их средних квадратических отклонений (случайных ошибок) и определяется с помощью критерия Стьюдента.
Расчетные значения
сравниваются,
с определенным по таблице, при уровне
значимости
и числе степеней свободы
значением
.
В частности,
.
Замечание. При оценке надежности параметров регрессии можно использовать грубое правило: если стандартная ошибка больше модуля, исследуемого параметра, то он не может быть принят как значимый.
В
парной линейной регрессии
.
Действительно, поскольку факторную
сумму квадратов можно представить в
виде
,
а остаточную сумму квадратов как –
,
то
.
Кроме того
.
Таким образом,
.
Так
как
,
,
,
то признается значимость коэффициента
корреляции
и неслучайная природа коэффициентов
и
.
Для
построения доверительных интервалов
необходимо вычислить предельные ошибки
оцениваемых величин. Поскольку
,
,
имеют одно и то же распределение
Стьюдента, то предельные ошибки, очевидно,
даются соотношениями
,
.
После решения вопроса о значимости коэффициента корреляции , коэффициентов , и уравнения регрессии в целом можно установить доверительные интервалы этих величин в генеральной совокупности. Для каждого показателя имеем:
Доверительные вероятности параметров регрессии можно представить в виде
5 этап. Оценим точность модели вычислением среднего относительного отклонения расчетных данных от фактических. Допустимый предел значений должен быть не более 10%. Вычисляем относительную ошибку аппроксимации
Модель хорошо отражает зависимость между изучаемыми факторами x и y, если ошибка менее 10%. В нашем случае, средняя относительная ошибка аппроксимации, как мера рассеяния эмпирических точек вокруг теоретической линии регрессии меньше 10%, что говорит о высокой точности модели и свидетельствует о достаточном объеме выборки. Для повышения точности модели, количество наблюдений следует увеличить.
6
этап.
Полученные оценки параметров
,
при условии значимости их величин,
позволяют использовать уравнение
регрессии для прогноза.
Обозначим
через
значение прогнозируемого показателя
для фактора
,
тогда используя формулу
для того же фактора, мы допускаем ошибку
Здесь
,
определяемые по неизвестной нам
генеральной совокупности коэффициенты.
Поскольку оценки
являются реализациями случайных
величин-выборок, то наблюдаемая ошибка
прогноза
так же является реализацией случайной
величины. При этом имеются два источника
неопределенности ошибки прогноза: 1)
отклонения
от значений, вычисленных по генеральной
совокупности; 2) неопределенность ошибки
.
Если выполнены предпосылки МНК (мы это предполагаем), то имеет место соотношение
верное
в силу несмещенности оценок параметров
регрессии
,
,
.
Точность прогноза зависит от дисперсии
ошибки прогноза
Здесь
учтено, что
– неслучайная (хотя и не известная)
величина.