
- •Проверка качества уравнения регрессии
- •Интервальные оценки коэффициентов линейного уравнения регрессии.
- •Проверка общего качества уравнения регрессии. Коэффициент детерминации .
- •Критерий Фишера (f-тест).
- •Прогнозирование в регрессионных моделях.
- •Интервалы прогноза по линейному уравнению регрессии.
- •Доверительный интервал для индивидуальных значений зависимой переменной.
- •Проверка значимости уравнения регрессии в случае множественной регрессии.
- •Статистическая значимость коэффициентов множественной линейной регрессии.
Интервальные оценки коэффициентов линейного уравнения регрессии.
Для оценки статистической значимости коэффициентов регрессии и корреляции, кроме t-критерия Стъюдента, рассчитываются также доверительные интервалы каждого из показателей.
Одной
из базовых предпосылок метода наименьших
квадратов является предположение о
нормальном распределении отклонений
с нулевым математическим ожиданием и
постоянной дисперсией. Тогда статистики
,
или
имеют
распределение Стьюдента с числом
степеней свободы
и
можно определить доверительные
интервалы,
которые с надежностью
накрывают
определяемые параметры
и
:
(1)
Аналогичное
двойное неравенство можно вывести для
:
(2)
находится с помощью уровня значимости
α и степенью свободы
.
В экономических исследованиях все проверки гипотез осуществляются либо при 5%-ном, либо при 1%-ном уровнях значимости: α=0,05; α=0,01.
Доверительные интервалы для параметров регрессии говорят о следующем: теоретические значения параметров регрессии с вероятностью 95% попадают в интервал (1) или (2).
Лекция 7
Проверка общего качества уравнения регрессии. Коэффициент детерминации .
Общее
качество уравнения регрессии оценивается
по тому, насколько хорошо эмпирическое
уравнение регрессии согласуется со
статистическими (фактическими) данными.
Если все точки лежат на построенной
прямой, то говорят, что регрессия y
на x
«идеально» объясняет поведение
результативного признака.
Суммарной
мерой общего качества уравнения регрессии
(соответствия уравнения регрессии
статистическим данным) является
коэффициент
детерминации
.
Вообще проверка значимости уравнения регрессии проводится на основе дисперсионного анализа. В математической статистике дисперсионный анализ рассмотрен как самостоятельный метод статистического анализа. Здесь же он применятся как вспомогательное средство для изучения качества регрессионной модели.
Рассмотрим следующие суммы:
– дисперсия фактических (наблюдаемых)
значений y
(общая сумма),
–
дисперсия расчетных значенийy
(объясненная регрессией),
– дисперсия
регрессионных остатков (необъясненная
регрессией).
Рассмотрим общую сумму:
=
=
Можно
показать, что если оценки
и
определены
по методу наименьших квадратов, то сумма
=0
.
Тогда
=
(1)
общая объясненная остаточная сумма
сумма квадратов регрессией или
факторная сумма
квадратов
Коэффициентом детерминации R2 называется отношение факторной суммы к общей сумме.
(2)
Соотношение (2) характеризует долю вариации (разброса) зависимой переменной, объясненную с помощью уравнения регрессии.
Если все точки лежат на регрессионной прямой, то R2=1.
Если R2=1, то получается подгонка абсолютно точная, т.е. все точки наблюдений лежат на прямой, значит, имеется функциональная связь.
Если R2=0, то получается, что уравнение регрессии ничего не дает.
Чем ближе R2 к 1, тем уравнение регрессии лучше.
В практических задачах для оценки силы связи используется следующая таблица:
Значение R2 |
[0,1-0,3) |
[0,3-0,5) |
[0,5-0,7) |
[0,7-0,9) |
[0,9-0,99) |
сила связи |
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
Замечание:
Вычисление R2
корректно,
если константа
включена в уравнение регрессии.
Коэффициент детерминации можно выразить иначе:
или
,
откуда
,
то есть
.
Для
линейной парной регрессии коэффициент
детерминации равен
квадрату коэффициента корреляции.