
- •5. Проверка качества уравнения регрессии
- •5.1. Классическая линейная регрессионная модель. Предпосылки метода наименьших квадратов
- •Дисперсии и стандартные ошибки коэффициентов регрессии
- •5.3. Проверка гипотез относительно коэффициентов линейного уравнения регрессии
- •5.4. Интервальные оценки коэффициентов линейного уравнения регрессии
- •5.5. Доверительные интервалы для зависимой переменной
- •5.6. Проверка общего качества уравнения регрессии. Коэффициент детерминации r2
5.4. Интервальные оценки коэффициентов линейного уравнения регрессии
Одной
из базовых предпосылок МНК
является предположение о нормальном
распределении отклонений
с нулевым математическим ожиданием и
постоянной
дисперсией, т.е.
.
СВ
и
также
имеют
нормальные распределения. Действительно,
как известно,
линейная комбинация нормально
распределенных СВ является
нормально распределенной СВ. Коэффициенты
и
могут быть представлены
в виде:
,
.
Другими
словами,
и
являются
линейными комбинациями
.
В свою очередь
является линейной комбинацией
.
Тогда
и
через
являются линейными
функциями от
,
имеющими нормальное распределение.
Следовательно,
и
также
распределены нормально.
Как отмечалось ранее, , .
,
.
Следовательно,
,
.
Тогда статистики
,
имеют распределение Стьюдента с числом
степеней свободы
.
Далее для определения
-го
доверительного интервала с помощью
таблиц критических точек распределения
Стьюдента по доверительной вероятности
и
числу степеней свободы
определяют критическое значение
,
удовлетворяющее условию
|
(5.16) |
После преобразований выражений, стоящих в скобках, получаем соотношения определяющие доверительные интервалы параметров и :
|
(5.17) |
|
(5.18) |
которые
с надежностью
накрывают определяемые параметры
и
.
Фактически доверительный интервал определяет значения теоретических коэффициентов регрессии и , которые будут приемлемыми с надежностью при найденных оценках и .
5.5. Доверительные интервалы для зависимой переменной
Одной из центральных задач эконометрического моделирования является предсказание (прогнозирование) значений зависимой переменной при определенных значениях объясняющих переменных. Здесь возможен двоякий подход: либо предсказать условное математическое ожидание зависимой переменной при определенных значениях объясняющих переменных (предсказание среднего значения), либо прогнозировать некоторое конкретное значение зависимой переменной (предсказание конкретного значения).
Предсказание
среднего значения.
Пусть
построено уравнение
парной регрессии
,
на основе которого необходимо
предсказать условное математическое
ожидание
переменной
Y
при
.
Как
сильно может уклониться модельное
среднее значение
,
рассчитанное
по эмпирическому уравнению
регрессии, от соответствующего условного
математического ожидания. Ответ на этот
вопрос дается на основе интервальных
оценок, построенных с заданной надежностью
при любом конкретном значении
объясняющей
переменной.
СВ
имеет нормальное распределение, тогда
|
(5.19) |
имеет
распределение Стьюдента с числом
степеней свободы
.
Следовательно, по таблице критических
точек распределения
Стьюдента по требуемому уровню значимости
и числу степеней
свободы
можно
определить критическую точку
,
удовлетворяющую
условию
.
Доверительный
интервал для
имеет вид:
|
(5.20) |
Для проверки гипотезы
,
используется
статистика:
,
имеющая
распределение Стьюдента с числом
степеней свободы
.
Поэтому
отклоняется, если
(
- требуемый
уровень значимости).
Предсказание
индивидуальных значений зависимой
переменной.
Пусть
нас интересует некоторое возможное
значение
переменной
Y
при определенном значении
объясняющей
переменной X.
Предсказанное по уравнению регрессии
значение
Y
при
составляет
.
Если рассматривать значение
как
СВ
,
a
-
как СВ Yр,
то можно отметить, что
а
.
СВ
имеет нормальное распределение с
и
.
Тогда СВ
имеет распределение Стьюдента с числом степеней свободы .
Интервал
|
(5.21) |
определяет
границы, за пределами которых могут
оказаться не более
точек наблюдений при
.
Заметим,
что данный
интервал шире доверительного интервала
для условного математического ожидания
(на рис. 5.4 границы этого интервала
отмечены
пунктирной линией). Проводя
анализ построенных интервалов, несложно
заметить,
что наиболее узкими они будут при
.
По мере удаления
от среднего значения доверительные
интервалы расширяются.
Поэтому необходимо достаточно осторожно
экстраполировать
полученные результаты на прогнозные
области.