
- •Кафедра «Эконометрика и прикладная информатика в дизайне» методические указания
- •2. Традиционный метод наименьших квадратов (мнк)
- •3. Статистические свойства вектора оценок коэффициентов регрессии
- •4. Теорема Гаусса - Маркова
- •5. Несмещенные оценки дисперсии ошибок, ковариационной матрицы и дисперсии выборочных коэффициентов регрессии
- •6. Оценка значимости и доверительных интервалов для коэффициентов регрессии
- •7. Анализ вариации зависимой переменной
- •Значения сумм квадратов
- •Значения дисперсий
- •8. Выборочный коэффициент детерминации
- •9. Скорректированный коэффициент детерминации
- •10. Оценка значимости уравнения регрессии
- •11. Доверительный интервал для значений зависимой переменной
- •II. Демонстрационный пример выполнения задания
- •Зависимость объема реализации уi, руб. От цены продукции хi1, руб. И расходов на рекламу хi2, руб.
- •Задание
- •Решение
- •Расчетная таблица
- •Вспомогательная таблица для функции линейн
- •III. Задача для самостоятельного выполнения
- •Варианты заданий
7. Анализ вариации зависимой переменной
Общая
сумма квадратов отклонений
разбивается на два слагаемых
Q = Qr+Qe (1.24)
где
,
–
соответственно
факторная и остаточная суммы квадратов.
По
аналогии со случаем парной регрессии
эти суммы можно выразить через вектор
выборочных коэффициентов b
и выборочный коэффициент детерминации
(табл. 1.1)
Таблица 1.1
Значения сумм квадратов
Название |
Общее выражение |
Выражение через b |
Выражение
через
|
Общая |
|
|
|
Факторная |
|
|
|
Остаточная |
|
|
|
При делении суммы квадратов на число ее степеней свободы получается несмещенная оценка соответствующей дисперсии (табл. 1.2).
Таблица 1.2
Значения дисперсий
Название |
Df |
Выражение |
Общая |
df = n – 1 |
|
Факторная |
df = p |
|
Остаточная |
df = n – p – 1 |
|
8. Выборочный коэффициент детерминации
Выборочный множественный коэффициент детерминации показывает качество подгонки регрессионной модели к наблюдаемым значениям уi и определяется выражением (в отличие от случая модели парной регрессии он обозначается )
(1.25)
Свойства коэффициента (в дополнение к свойствам для частного случая парной регрессии):
1. Коэффициент служит для оценки значимости (качества) уравнения регрессии, является одной из наиболее эффективных оценок адекватности регрессионной модели, характеристикой ее прогностической силы.
2.
Коэффициент
при
выполнении 5-го условия КЛММР является
состоятельной, но смещенной оценкой
генерального коэффициента детерминации
,
с
математическим ожиданием и дисперсией,
приближенно определяемыми выражениями
;
3. Коэффициент – безразмерная величина, лежащая в пределах 0≤ ≤1.
4.
При
=
0 вариация зависимой переменной полностью
обусловлена воздействием неучтенных
в модели переменных и линия регрессии
не улучшает качество предсказания
значений уi
по
сравнению с тривиальным предсказанием
(Qr=0,
Q
= Qe).
5. При = 1 осуществляется точная подгонка и все эмпирические точки уi удовлетворяют уравнению регрессии (Qr =Q, Qe=0).
6. Коэффициент может быть вычислен из матрицы парных коэффициентов корреляции по формуле:
(1.26)
где
– определитель симметричной квадратной
матрицы выборочных парных коэффициентов
корреляции (p
+ 1)-го порядка
с элементами (k, j = 1, 2, ..., р)
;
(1.28)
(1.29)
;
Δ00 – алгебраическое дополнение 0-го элемента 0-й строки матрицы (1.27), по сути представляющее собой определитель det RXX матрицы межфакторной парной корреляции p-го порядка
.
(1.30)
Выражение (1.26) определяет выборочный множественный коэффициент детерминации p-гo порядка (по числу p объясняющих переменных). Множественные коэффициенты детерминации низших порядков определяются аналогичным образом из соответствующих подматриц матрицы RyX.
Так,
выборочный множественный коэффициент
детерминации 1-го порядка
,
равный
квадрату парного коэффициента корреляции
между результирующей у
и
j-ой
объясняющей переменной xj,
находится по формуле
(1.31)
где
– определитель подматрицы
,
получаемой из матрицы RyX
путем
вычеркивания всех строк и столбцов
кроме тех, которые соответствуют
переменным у
и
xj:
(первые
j-е
строка и столбец); Δ11
– алгебраическое дополнение 1-го элемента
1-й строки этой подматрицы. Выборочный
множественный коэффициент детерминации
2-го порядка
для
объясняемой у
и
факторных переменных xj,
хk
определяется
выражением
(1.32)
где
– определитель подматрицы
|,
которая находится из матрицы RyX
в
результате вычеркивания всех строк и
столбцов кроме тех, которые отвечают
у,
xj
и
хk;
Δ11
– алгебраическое дополнение 1-го элемента
1-й строки полученной подматрицы.
Выборочные множественные коэффициенты детерминации более высоких порядков находятся аналогичным образом.
7. Величина , вообще говоря, возрастает при добавлении новых регрессоров (поскольку растет Qr), хотя это не обязательно означает улучшение качества регрессионной модели.
Поскольку присоединение в уравнение регрессии каждой новой предикторной переменной не может уменьшить величины коэффициента детерминации (независимо от порядка присоединения), множественные коэффициенты детерминации различных порядков удовлетворяют цепочке неравенств
(1.33)
Попыткой устранить эффект, связанный с ростом при добавлении новых объясняющих переменных, является коррекция на число регрессоров.