- •Тема 5. Регрессионный анализ § 5.1. Простая линейная регрессионная модель и оценивание по методу наименьших квадратов
- •5.2. Проверка гипотез и доверительные интервалы
- •§ 5.3. Множественная линейная регрессия и ее исследование
- •§ 5.4. Проверка адекватности регрессионной модели
- •§ 5.5. Анализ остатков
- •Р ис. 5.3. Примеры графиков остатков. А – адекватная модель;
- •§ 5.6. Интерпретация оценок параметров линейного уравнения множественной регрессии
- •§ 5.7. Понятие о нелинейной регрессии
- •§ 5.8. Вопросы для самопроверки
- •§ 5.9. Задачи
- •Тема 6. Однофакторный дисперсионный анализ § 6.1. Постановка задачи
- •Представление данных для однофакторного дисперсионного анализа
- •§ 6.2. Проверка гипотез
- •§ 6.2. Вопросы для самопроверки
- •§ 6.3. Задачи
§ 5.4. Проверка адекватности регрессионной модели
На этом этапе оценивается пригодность регрессионной модели для решения задач анализа и прогноза исследуемых экономических процессов.
Традиционными методами анализа адекватности линейной регрессионной модели (ЛРМ) являются:
1) дисперсионный анализ модели,
2) анализ остатков (отклонений, возмущений),
3) статистическая проверка гипотез о параметрах модели и уравнении в целом.
Дисперсионный анализ (ANOVA) ЛРМ заключается в оценивании вклада в дисперсию зависимой переменной Y, которую вносят включенные в модель независимые переменные и неконтролируемые случайные факторы, приводящие к случайным ошибкам наблюдения .
Основное уравнение дисперсионного анализа имеет вид:
![]()
где
– сумма квадратов отклонений зависимой
переменной от выборочного среднего
значения
,
называемая полной суммой квадратов;
–
сумма квадратов отклонений прогнозных значений от среднего, обусловленная регрессионной моделью, т.е. включенными в модель переменными;
–
сумма квадратов остатков (или остаточная сумма квадратов).
Всякая сумма квадратов
связана с числом, называемым ее степенями
свободы, т.е. числом независимых элементов
информации, получающихся из n
независимых величин
.
Число степеней свободы для перечисленных
сумм квадратов простой линейной регрессии
соответственно равно:
.
Они удовлетворяют
уравнению:
.
Для множественной линейной регрессии
.
Важной характеристикой адекватности ЛРМ является величина
,
называемая
коэффициентом детерминации модели (см.
множественный коэффициент корреляции
).
Характеристикой точности прогноза на основе построенной модели является среднеквадратическая (стандартная) ошибка прогноза, совпадающая с оценкой среднеквадратического (стандартного) отклонения ошибок:
.
§ 5.5. Анализ остатков
В предыдущем рассмотрении
простой линейной регрессии были сделаны
три предположения. Они касались формы
модели, распределения и случайности
величины ошибки .
Все три предположения могут быть
проверены при рассмотрении графиков
остатков
.
Такие графики включены в состав выходных
данных программ большинства ПСП.
Для проверки адекватности
модели можно использовать график di
в зависимости от xi
или
.
Если остатки попадают в горизонтальную
полосу с центром на оси абсцисс, модель
можно рассматривать как адекватную
(рис. 5.3, а). Если полоса расширяется,
когда х или
возрастает (рис. 5.3, b),
это указывает на гетероскедастичность
(т.е. на отсутствие постоянства дисперсии
2).
В частности, может
быть функцией
,
что делает необходимым преобразование
переменной Y. График,
показывающий линейный тренд (рис. 5.4.),
дает основание для введения в модель
дополнительной независимой переменной
(см. § 5.3). График вида,
представленного на рис. 5.3. d,
указывает, что в модель должен быть
добавлен линейный или квадратичный
член.
Для проверки нормальности
,
подходит гистограмма di.
Нормальность может быть также проверена
с помощью критериев согласия.
Р ис. 5.3. Примеры графиков остатков. А – адекватная модель;
b – гетероскедастичность; с – линейная независимая переменная;
d
– линейная или квадратичная
независимая переменная.
Рис. 5.4. Примеры отсутствия случайности.
а – сезонный тренд; b – линейный тренд.
