- •Тема 9. Введение в регрессионный анализ.
- •1. Теоретическая и практическая задачи регрессионного анализа.
- •2. Задача линейной регрессии и оценка по методу наименьших квадратов.
- •3. Свойства оценки по методу наименьших квадратов в задаче линейной регрессии.
- •4. Оценка остаточной дисперсии.
- •5. Качество регрессии и коэффициент детерминации.
- •6. Задача нормальной линейной регрессии.
- •7. Интервальное оценивание в задаче нормальной линейной регрессии.
3. Свойства оценки по методу наименьших квадратов в задаче линейной регрессии.
Пусть
известно, что выполняется (9.1), тогда
наблюдение
имеет вид:
|
…,
|
(9.4) |
Будем
дополнительно предполагать, что случайные
величины
,
…,
имеют следующие свойства:
|
(9.5) |
Предположим,
что на основании результатов предыдущего
пункта получена оценка по методу
наименьших квадратов
.
Оценка
,
зависящая от наблюдения
,
является векторной случайной величиной,
поэтому возникает вопрос о свойствах
оценки
и о том каким образом связаны между
собой оценка
и неизвестный вектор параметров
.
Теорема 9.3.
Если
в задаче линейной регрессии (9.1)-(9.5)
,
тогда:
1)
оценка
является несмещенной оценкой
:
;
2)
если
несмещенная и линейная по наблюдению
оценка
,
тогда:
,
.
то
есть компоненты
в оценке
имеют наименьшую дисперсию среди всех
несмещенных и линейных по наблюдению
оценок
.
3)
дисперсионная матрица
оценки
имеет вид:
.
Доказательство:
1) Из (9.2) и (9.4) следует:
,
где
вектор столбец
и вектор столбец
.
Отсюда следует, что:
.
В
силу условия (9.5) пункт 1
,
тогда:
.
Дисперсионная
матрица
вектора
:
.
В
силу условия (9.5) пункты 2 и 3 диагональные
элементы
(
),
остальные элементы
(
,
),
тогда:
,
где
– единичная матрица порядка
.
2)
Поскольку
,
то из (9.3) (утверждение 9.2 пункт 2) следует
,
тогда математическое ожидание
:
.
Таким
образом, оценка по методу наименьших
квадратов
является несмещенной оценкой
.
3)
Поскольку
,
то
(утверждение 9.2 пункт 2) и как легко видеть
оценка
линейно зависит от
.
Покажем, среди всех несмещенных и
линейных по
оценок
компоненты
в оценке
имеют наименьшую дисперсию, для этого
рассмотрим произвольную несмещенную
и линейную по
оценку
и покажем, что дисперсии
компонент
оказываются минимальными только тогда,
когда оценка
совпадает с оценкой по методу наименьших
квадратов
.
Пусть
– произвольная несмещенная и линейная
по
оценка
,
тогда:
,
где
– некоторая матрица порядка
.
Из условия несмещенности оценки
следует:
,
причем
равенство должно быть справедливо для
произвольного
,
это возможно тогда и только тогда, когда:
|
|
(9.6) |
где
– единичная матрица порядка
.
Вычислим
дисперсионную матрицу
оценки
:
![]()
![]()
![]()
|
|
(9.7) |
Диагональные
элементы дисперсионной матрицы
являются дисперсиями компонент вектора
:
,
.
Какова
должна быть матрица
,
чтобы с одной стороны выполнялось
равенство (9.6) (которое следует из
требования несмещенности) и с другой
стороны диагональные элементы
были как можно меньше? Покажем, что
матрица
должна быть равна матрице
,
при которой получается оценка по методу
наименьших квадратов
.
Пусть
для матрицы
выполняется (9.6), рассмотрим квадрат
разности
:
![]()
![]()
.
Таким
образом, если для
справедливо (9.6), тогда:
![]()
В
правой части от матрицы
зависит только второе слагаемое, поэтому
диагональные элементы
принимают наименьшее значение, когда
наименьшее значение принимают диагональные
элементы матрицы
.
Пусть
,
заметим, что диагональный элемент в
-ой
строке матрицы
есть сумма квадратов элементов
расположенных в
-ой
строке матрицы
:
.
Сумма
квадратов будет минимальна, если все
элементы равны нулю, отсюда во всех
строках все элементы матрицы
должны быть равны нулю (
– матрица порядка
состоящая из нулей):
![]()
![]()
.
Легко
видеть, что
,
то есть матрица
удовлетворяет (9.6). Таким образом, среди
всех матриц
,
удовлетворяющих (9.6), только при матрице
диагональные элементы матрицы
,
то есть дисперсии
,
принимают наименьшие значения, но при
оценка
становится оценкой по методу наименьших
квадратов
.
Таким образом, каждая компонента
в оценке
имеет наименьшую возможную дисперсию
среди всех несмещенных и линейных по
оценок
.
3)
Если
,
тогда
и из (9.7) непосредственно следует, что:
.
Поскольку
,
то матрица
симметричная. Обратная матрица всякой
симметричной матрицы тоже симметрична,
поэтому
– симметричная матрица, то есть
,
тогда:
.
Теорема доказана.
