
- •1. Простые и сложные статистические гипотезы.
- •2. Проверка статистических гипотез
- •3. Построение критерия проверки гипотезы.
- •1. Проверка гипотез о значении параметров распределения
- •2. Критерий согласия Пирсона
- •Выборочная линейная среднеквадратическая регрессия
- •Свойства линейной регрессии и коэффициента корреляции.
- •3. О множественной регрессии
- •4. О нелинейной регрессии
3. О множественной регрессии
На практике
объясняемая переменная
часто зависит не от одной, а нескольких
объясняющих переменных
.
Пусть таких переменных будет
,
и они наблюдаются вместе с переменной
в многофакторной выборке
объема n.
Построим выборочную линейную
регрессию в форме:
,
если введем
следующие вектора
,
,
то ее можно записать в векторном виде:
Введем матрицу
изменений
,
вектора измерения
и переменных
,
а так же вектор регрессии
:
,
,
,
,
тогда для вектора
регрессии будет
,
а ошибки регрессии
.
Построим оценки
коэффициентов регрессии
методом
наименьших квадратов, для чего рассмотрим
суммарную ошибку регрессии
.
Подберем такие
коэффициенты
,
при которых суммарная ошибка регрессии
минимальна, для этого рассмотрим условие
минимума:
,
.
Таким образом, оценка для коэффициентов регрессии построена. Матрица, входящая в выражение для коэффициентов имеет вид средних перекрестных произведений:
,
.
Значимость
построенного уравнения линейной
среднеквадратической регрессии
проверяется по значимости коэффициентов
регрессии
или коэффициента детерминации
.
Для проверки вычисляются:
-
дисперсия ошибок регрессии,
- несмещенная стандартная ошибка
регрессии,
- несмещенные дисперсии коэффициентов
регрессии. Для построения критериев
значимости воспользуемся известными
статистиками:
~ распределение
Стьюдента с
степенями
свободы,
~F-распределение
Фишера с
степенями свободы. Задаваясь уровнем
значимости
проверяемой гипотезы
,
соответствующей независимости величин
и
,
можно сравнить наблюдаемое значение
критерия
,
с критическим значением
.
Если
,
то гипотеза принимается, что говорит о
незначимости коэффициента
,
мало отличного от нуля, то есть о
незначимости переменной
в уравнении регрессии, такие переменные
желательно исключить из модели регрессии.
Аналогично проверяется гипотеза о
значимости коэффициента детерминации
,
соответствующей значимости всего
уравнения регрессии в целом. Сравнивая
наблюдаемое значение критерия
,
с критическим значением
,
можно утверждать, что если
,
то гипотеза принимается, что говорит о
незначимости коэффициента
,
мало отличного от нуля, то есть о не
значимости уравнения регрессии в
целом.
Помимо значимости
построенного уравнения регрессии, его
качество оценивается так же отсутствием
зависимости между объясняющими
переменными
(мультиколлинеарности), отсутствием
зависимости величины дисперсии ошибок
от переменных
и
(гетероскедастичности), отсутствием
зависимости ошибок
между собой (например, автокорреляции).
Мультиколлинеарность
приводит к неустойчивости обращения
матрицы W, а ее устранение
возможно путем исключения из регрессионной
модели малозначимых и сильнозависимых
объясняющих переменных (факторов). Для
этого исключения построим корреляционную
матрицу парных коэффициентов корреляции:
.
Тогда, если
,
а коэффициент
незначим или малозначим, то переменную
можно исключить из модели регрессии,
если коэффициент детерминации при этом
значимо не уменьшается.
Гетероскедастичность и автокорреляция могут быть установлены при помощи теста ранговой корреляции Спирмена и теста Дарбина-Уотсона соответственно [1]. Влияние этих нежелательных для качества регрессии факторов может быть ослаблено путем различного рода преобразования переменных регрессионной модели [9].