 
        
        - •Проверка качества уравнения регрессии
- •Предпосылки метода наименьших квадратов
- •Анализ точности определения оценок коэффициентов регрессии
- •3. Проверка гипотез относительно коэффициентов линейного уравнения регрессии
- •4. Интервальные оценки коэффициентов линейного уравнения регрессии
- •5. Доверительные интервалы для зависимой переменной
- •6. Проверка общего качества уравнения регрессии
- •9 Проверка качества уравнения регрессии
Проверка качества уравнения регрессии
- Предпосылки метода наименьших квадратов
Регрессионный анализ позволяет определить оценки коэффициентов регрессии. Но, являясь лишь оценками, они не позволяют сделать вывод:
- насколько близки оценки коэффициентов  и и к своим теоретическим коэффициентам к своим теоретическим коэффициентам и и ; ;
- насколько надежны найденные оценки; 
- как близко оцененное значение  к условному математическому ожиданию к условному математическому ожиданию ; ;
- насколько точно эмпирическое уравнение регрессии соответствует уравнению для всей генеральной совокупности. 
Из соотношения 
 ,
, ,
 следует, что значения
,
 следует, что значения зависят от значений
зависят от значений и случайных отклонений
и случайных отклонений .
Следовательно, пока не будет определенности
в вероятностном поведении
.
Следовательно, пока не будет определенности
в вероятностном поведении ,
мы не сможем быть уверенными в качестве
оценок.
,
мы не сможем быть уверенными в качестве
оценок.
Рассмотрим модель парной линейной
регрессии: 
 .
.
Пусть на основе выборки из nнаблюдений
оценивается регрессия: .
.
Покажем, что оценки коэффициентов
регрессии 
 и
и являются СВ, которые зависят от случайного
члена
являются СВ, которые зависят от случайного
члена в уравнении регрессии.
в уравнении регрессии.
Выше показано, что коэффициент регрессии
 можно вычислить по формуле:
можно вычислить по формуле:
 .
.
Видно,  что коэффициент 
 является случайным, т.к. значение
выборочной ковариации
является случайным, т.к. значение
выборочной ковариации зависит от значений переменныхXиY. Если переменнаяX– это
экзогенный фактор, значения которого
известны, то значения переменнойYзависят от случайной составляющей
зависит от значений переменныхXиY. Если переменнаяX– это
экзогенный фактор, значения которого
известны, то значения переменнойYзависят от случайной составляющей
 .
Теоретически коэффициент
.
Теоретически коэффициент можно разложить на неслучайную и
случайную составляющие:
можно разложить на неслучайную и
случайную составляющие:

 .
.
Здесь 
 – это постоянная величина (истинное
значение коэффициента регрессии), а
– это постоянная величина (истинное
значение коэффициента регрессии), а – это случайная величина. Аналогичный
результат можно получить и для
– это случайная величина. Аналогичный
результат можно получить и для .
.
Мы показали, что оценки коэффициентов регрессии, а следовательно, и качество построенной регрессии, зависят от свойств случайной составляющей.
Для получения по МНК наилучших оценок необходимо выполнение предпосылок Гаусса–Маркова относительно случайного отклонения:
1. Математическое ожидание случайного
отклонения для всех наблюдений равно
нулю: 
 .
Данное условие означает, что случайное
отклонение «в среднем» не оказывает
влияния на зависимую переменную.
Выполнимость
.
Данное условие означает, что случайное
отклонение «в среднем» не оказывает
влияния на зависимую переменную.
Выполнимость
 влечет выполнимость
влечет выполнимость
 ,
, .
.
2. Дисперсия случайных отклонений
постоянна для любых наблюдений i и j: 
 .Выполнимость данной предпосылки
называетсягомоскедастичностью(постоянством дисперсии отклонений), а
невыполнимость –гетероскедастичностью(непостоянством дисперсии отклонений).
Т.к.
.Выполнимость данной предпосылки
называетсягомоскедастичностью(постоянством дисперсии отклонений), а
невыполнимость –гетероскедастичностью(непостоянством дисперсии отклонений).
Т.к.
 ,
то данную предпосылку можно переписать
в виде:
,
то данную предпосылку можно переписать
в виде:
 .
.
3. Случайные отклонения 
 и
и являются независимыми друг от друга
для
являются независимыми друг от друга
для ,
т.е. не коррелированны:
,
т.е. не коррелированны:
Выполнение данной предпосылки говорит об отсутствии автокорреляции. С учетом предпосылки 1 последнее соотношение можно записать в виде:
 ,если
,если
 .
.
4. Случайные отклонения являются независимыми от экзогенных переменных. Данное условие предполагает выполнимость следующего соотношения:

 .
.
5. Модель является линейной относительно параметров.
Теорема (Гаусса–Маркова).Если предпосылки 1–5 выполняются, то оценки, полученные МНК, обладают следующими свойствами:
- Оценки являются несмещенными, т.е.  и и .
	Это вытекает из того, что .
	Это вытекает из того, что ,
	и говорит об отсутствии систематической
	ошибки в определении положения линии
	регрессии. ,
	и говорит об отсутствии систематической
	ошибки в определении положения линии
	регрессии.
- Оценки являются состоятельными, т.е. дисперсия оценок параметров при возрастании числа наблюдений стремиться к нулю:  и и .
	Другими словами, при увеличении объема
	выборки надежность оценок увеличивается,
	т.е. .
	Другими словами, при увеличении объема
	выборки надежность оценок увеличивается,
	т.е. близко к близко к ,
	а ,
	а близко к близко к . .
- Оценки являются эффективными, т.е. они имеют наименьшую дисперсию по сравнению с любыми другими оценками данных параметров. 
В англоязычной литературе такие оценки называются BLUE (Best Linear Unbiased Estimators) – наилучшие линейные несмещенные оценки.
Наряду с выполнимостью указанных предпосылок делаются предположения, что экзогенные переменные не являются СВ, случайные отклонения имеют нормальное распределение, число наблюдений существенно больше числа независимых переменных, отсутствуют ошибки спецификации.
