
- •Проверка качества уравнения регрессии
- •Интервальные оценки коэффициентов линейного уравнения регрессии.
- •Проверка общего качества уравнения регрессии. Коэффициент детерминации .
- •Критерий Фишера (f-тест).
- •Прогнозирование в регрессионных моделях.
- •Интервалы прогноза по линейному уравнению регрессии.
- •Доверительный интервал для индивидуальных значений зависимой переменной.
- •Проверка значимости уравнения регрессии в случае множественной регрессии.
- •Статистическая значимость коэффициентов множественной линейной регрессии.
Лекция 6
Проверка качества уравнения регрессии
Качество модели регрессии в определенной степени определяет адекватность построенной модели исходным (наблюдаемым) данным.
Рассмотрим сначала случай линейной парной регрессии.
,
;
,
.
Полученные
по методу наименьших квадратов оценки
и
тем
надежнее, чем меньше их разброс вокруг
и
,
то есть чем меньше дисперсии
и
.
Надежность получаемых оценок тесно
связана с дисперсией случайных отклонений
.
Приведем
формулы связи дисперсий коэффициентов
и
с дисперсией
случайных отклонений
.
Для этого представим формулы определении
коэффициентов в следующем виде:
.
Отсюда
,
так как
или
,
где
.
Аналогично:
или
,
где
.
Так
как дисперсия у
постоянна и не зависит от значений
переменной х,
то есть
,
то
и
можно
рассматривать как некоторые постоянные
величины. Тогда
=
=
=
.
,
так как
,
то
.
Рассмотрим преобразования
=
,
При
преобразованиях воспользовались тем,
что
,
,
то есть
.
Тогда
.
В
силу того, что случайные отклонения
по выборке определены быть не могут,
они заменяются отклонениями:
или
значений
от оцененной линии регрессии. Дисперсия
случайных отклонений
заменяется ее несмещенной оценкой:
Тогда
имеем:
,
,
где
-
необъясненная дисперсия (мера разброса
зависимой переменной вокруг линии
регрессии).
Величины
,
называются стандартными ошибками
коэффициентов регрессии.
Проверка гипотез о значимости коэффициентов линейного уравнения регрессии.
Коэффициенты
уравнения регрессии
и
являются случайными величинами,
меняющимися от выборки к выборке. Перед
исследователем возникает необходимость
сравнения коэффициентов
и
с некоторыми теоретически ожидаемыми
значениями этих коэффициентов. Данный
анализ осуществляется по схеме
статистической проверки гипотез.
Для
проверки гипотезы
,
.
Используется
статистика
,
которая при справедливости
имеет распределение Стьюдента с числом
степеней свободы
,
где k
- объем выборки. Следовательно,
отклоняется
на основании данного критерия, если
,
где
-
табличное значение,
-
требуемый уровень значимости.
Более
важной на начальном этапе статистического
анализа построенной модели является
задача установления линейной зависимости.
Эта проблема может быть решена по той
же схеме:
,
.
Гипотеза
в такой постановке обычно называется
гипотезой о статистической значимости
коэффициентов регрессии. При этом если
принимается, то есть основания считать,
что величинау
не зависит от х.
В этом случае говорят, что коэффициент
статистически незначим (он слишком
близок к нулю). При отклонении
коэффициент
считается статистически значимым, что
указывает на наличие зависимостиу
от
х.
Осуществляется такая проверка следующим образом. Вычисляется величина, которая называется t – статистикой
.
Эта
величина сравнивается с табличным
значением .
Если фактическое значение больше
табличного
,
то гипотезу
о несущественности коэффициента
регрессии
можно отклонить.
По
аналогичной схеме на основе t
– статистики проверяется гипотеза о
статистической значимости коэффициента
:
.
Отметим,
что для парной регрессии более важен
анализ статистической значимости
коэффициента
,
так как именно в нем скрыто влияниех
на у.