
- •Кафедра «Эконометрика и прикладная информатика в дизайне» методические указания
- •2. Традиционный метод наименьших квадратов (мнк)
- •3. Статистические свойства вектора оценок коэффициентов регрессии
- •4. Теорема Гаусса - Маркова
- •5. Несмещенные оценки дисперсии ошибок, ковариационной матрицы и дисперсии выборочных коэффициентов регрессии
- •6. Оценка значимости и доверительных интервалов для коэффициентов регрессии
- •7. Анализ вариации зависимой переменной
- •Значения сумм квадратов
- •Значения дисперсий
- •8. Выборочный коэффициент детерминации
- •9. Скорректированный коэффициент детерминации
- •10. Оценка значимости уравнения регрессии
- •11. Доверительный интервал для значений зависимой переменной
- •II. Демонстрационный пример выполнения задания
- •Зависимость объема реализации уi, руб. От цены продукции хi1, руб. И расходов на рекламу хi2, руб.
- •Задание
- •Решение
- •Расчетная таблица
- •Вспомогательная таблица для функции линейн
- •III. Задача для самостоятельного выполнения
- •Варианты заданий
9. Скорректированный коэффициент детерминации
Скорректированный (adjusted) коэффициент детерминации содержит поправки на число степеней свободы и определяется выражением
(1.34)
Коэффициент
также
называют адаптированным, нормированным
и, иногда не совсем правильно, исправленным
выборочным коэффициентом детерминации.
Свойства коэффициента :
1.
2.
Коэффициент
при
выполнении 5-го условия КЛММР является
состоятельной и, в отличие от
,
несмещенной оценкой генерального
коэффициента детерминации (
).
3.
,
но может принимать отрицательные
значения.
4. В отличие от , величина может уменьшиться при добавлении в модель новых регрессоров, не оказывающих существенного влияния на зависимую переменную.
10. Оценка значимости уравнения регрессии
Для оценки значимости уравнения регрессии естественно использовать величину
,
(1.35)
показывающую,
во сколько раз дисперсия, объясненная
регрессией, превышает остаточную. При
отсутствии какой бы то ни было линейной
статистической связи между зависимой
и совокупностью объясняющих переменных
(при βj
= 0,
j
= 1,
2, ..., р)
факторная
и
остаточная
дисперсии
будут близкими друг к другу и величина
F
будет
мала. При этом статистика (1.33) будет
иметь распределение Фишера – Снедекора
(F-распределение)
с k1
= р
и
k2
= n
– р – 1 степенями
свободы (рис. 1.2).
Следовательно, нулевая гипотеза о не значимости уравнения регрессии в целом (об одновременном равенстве нулю всех коэффициентов при факторных переменных) составляет Н0: β1 = β2 = … = βр.
Рис. 1.2. Плотность распределения вероятностей Фишера – Снедекора
с k1 = 5, k2 = 20 степенями свободы
Уровень значимости, как следует из рис. 1.2, определяется выражением
,
(1.36)
где
–
интегральная функция распределения
вероятностей. Доверительный уровень
находится по формуле
.
(1.37)
Критическая точка
(1.38)
находится по таблицам критических точек или с помощью стандартных функций в пакетах компьютерных программ.
Нулевая гипотеза Н0: β1 = β2 = … = βр принимается в случае, когда F < Fкр и с уровнем значимости α делается вывод о том, что уравнение регрессии незначимо.
В противном случае, когда F > Fкр, с уровнем значимости α делается вывод о том, что уравнение регрессии значимо.
Величина P-значения составляет
(1.39)
Из рис. 1.2 и сопоставления (1.36), (1.39) следует, что из неравенства P>α вытекает F<Fкр. При этом принимается основная гипотеза H0. Если же Р<α и F>Fкр, принимается конкурирующая гипотеза Н1, то есть с уровнем значимости ее делается вывод о том, что уравнение регрессии значимо.
11. Доверительный интервал для значений зависимой переменной
Ошибка регрессионного прогноза составляет
(1.40)
где
yi
и
–
соответственно действительное и
предсказанное значения зависимой
переменной.
Поскольку
и согласно (1.10), (1.11)
,
где
– вектор-строка, представляющий собой
i-ю
строку (i
= 1,
2,…, n)
матрицы
X
объясняющих переменных, ошибка (1.40)
имеет нулевое математическое ожидание
M[ei]
= 0.
Дисперсия ошибки определяется выражением
(1.41)
В силу того, что второе слагаемое в правой части (1.41) с учетом можно представить в виде
,
а первое слагаемое равно
,
их
сумма, представляющая собой величину
среднеквадратической ошибки интервального
прогноза значений результирующего
показателя для некоторого набора
значений
,
определяется
выражением
.
(1.42)
В
итоге посредством замены в (1.42) неизвестного
значения σ2
на
ее оценку
получается
несмещенная оценка дисперсии индивидуальных
значений независимой переменной уi,
соответствующих
значениям предикторов
(1.43)
Доверительный интервал для yi находится по формуле
(1.44)
где
;
;
tкp
= tкp(α;
k
= n
– р – 1)–
критическая
точка распределения Стьюдента с k
= n
– р – 1
степенями
свободы для уровня значимости α.