
- •8.2. Проверка гипотез о значимости коэффициентов линейного уравнения регрессии
- •8.3. Доверительные интервалы для зависимой переменной
- •8.4. Задание к лабораторной работе № 7 «Построение доверительных интервалов прогноза для линейного уравнения регрессии»
- •8.5. Проверка значимости всего уравнения регрессии в целом
- •8.6. Дисперсионный анализ для разложения общей суммы квадратов отклонений. Степени свободы для соответствующих сумм квадратов отклонений
- •8.7. Задание на лабораторную работу № 8 «Проверка значимости отдельных коэффициентов уравнения регрессии и всего уравнения регрессии в целом»
8.3. Доверительные интервалы для зависимой переменной
Одной из центральных задач эконометрического моделирования является предсказание (прогнозирование) значений зависимой переменной при определенных значениях объясняющих переменных. Здесь возможен двоякий подход: либо предсказать условное математическое ожидание зависимой переменной при определенных значениях объясняющих переменных (предсказание среднего значения), либо прогнозировать некоторое конкретное значение зависимой переменной (предсказание конкретного значения).
Предсказание среднего значения. Пусть построено уравнение парной регрессии yteor(xi) = b0 + b1xi, на основе которого необходимо предсказать условное математическое ожидание М(YХ = хp) переменной yteor(xp) при X = хp. В данном случае значение yteor(xp) = b0 + b1xp является оценкой (приближением) М(YХ = хp). Тогда естественным является вопрос, как сильно может уклониться модельное среднее значение yteor(xp), рассчитанное по эмпирическому уравнению регрессии, от соответствующего истинного условного математического ожидания yteor,true(xp) = 0 + 1xp. Ответ на этот вопрос дается на основе интервальных оценок, построенных с заданной надежностью (1-) при любом конкретном значении хр объясняющей переменной.
Чтобы построить доверительный интервал, покажем, что случайная величина yteor(xp) имеет нормальное распределение с конкретными параметрами. Используя формулы (8.1), (8.2), имеем:
yteor(xp) = b0 + b1xp = di yi +( ci yi)xp = (di +cixp)yi.
Следовательно, yteor(xp) является линейной комбинацией нормальных случайных величин и, значит, сама имеет нормальное распределение.
Myteor(xp) = M(b0 + b1xp) = M(b0)+ M(b1)xp = 0 + 1xp ,
Dyteor(xp) = D(b0 + b1xp) = D(b0)+ D(b1) +2cov(b0 ,b1)xp, (8.12)
(здесь используются формулы: D(X+Y) = D(Х)+D(У)+ 2соv(Х, Y); D(сХ) = с2D(Х); cov(Х, bY) = bсоv(Х, Y)).
cov(b0 ,b1) = M[(b0 – M(b0)(b1 – M(b1))] =
= M[(b0
- 0)(b1
– 1)]
= M[((b1
– M(b1))]
=
= -
M[(b1
- M(b1)(b1
– M(b1))]
=
M[(b1
- 1)(b1
– 1)]
=
= -D(b1)
=
.
Следовательно,
==
=.(8.13)
Так как
,
Поскольку
Подставив
вместо 2
её несмещенную оценку
получим выборочную исправленную
дисперсию D(yteor(xp))
рассматриваемой случайной величины.
Тогда случайная величина
(8.14)
имеет распределение Стьюдента с числом степеней свободы = n–2. Следовательно, по таблице критических точек распределения Стьюдента по требуемому уровню значимости и числу степеней свободы =n–2 можно определить критическую точку t/2,n-2, удовлетворяющую условию Р(Т < t/2,n-2) = 1–.
С учетом (7.3) имеем:
(8.15)
После алгебраических преобразований получим:
=1-.
(8.16)
Таким образом, доверительный интервал для гипотезы H0: M(YX=xp) = 0 + 0*хр имеет вид:
;
. (8.17)
В верхней строке приведена нижняя граница доверительного интервала, в нижней строке – верхняя граница доверительного интервала, в котором с надёжностью 1– находятся значения зависимого фактора, лежащие на линии регрессии
Для проверки гипотезы
H0: M(YX=xp) = yp;
H1: M(YX=xp) yp;
используется статистика:
(8.18)
имеющая распределение Стьюдента с числом степеней свободы = n -2. Поэтому H0 отклоняется, если |Tнабл | t/2,n-2 (– требуемый уровень значимости).
Рис.
8.1. Диаграмма нижних и верхних доверительных
границ для индивидуальных значений и
значений, лежащих на линии регрессии,
а также самой линии регрессии
Поскольку фактические
индивидуальные значения зависимой
переменной Y варьируют около среднего
регрессионного значения yteor(xp)
= b0
+ b1xp,
и так как они могут отклоняться от
yteor(xp)
= b0
+ b1xp
на величину среднеквадратического
отклонения 2,
которая оценивается как корень квадратный
из дисперсии
,
то нижние и верхние границы оцениваются
соответственно следующим образом:
;
.