- •1.2. Нормальная линейная модель парной регрессии
- •Основные свойства коэффициента корреляции
- •Формулы для вычисления коэффициента корреляции
- •§2. Определение качества модели регрессии.
- •2.1. Проверка гипотезы о значимости коэффициентов регрессии
- •2.2. Проверка гипотезы о значимости парного линейного коэффициента корреляции
- •2.3. Проверка гипотезы о значимости уравнения парной регрессии
- •2.4.Коэффициент детерминации
- •2.5. Адекватность регрессионной модели
1.2. Нормальная линейная модель парной регрессии
Нормальная, или классическая, линейная модель парной регрессии (регрессии с одной переменной) строится исходя из следующих предположений:
1) факторный признак xi является
неслучайной или детерминированной
величиной, не зависящей от распределения
случайной ошибки уравнения регрессии
;возмущение
(или зависимая переменная уi)
есть величина случайная.
2) математическое ожидание случайной
ошибки уравнения регрессии равно нулю
во всех наблюдениях:
,где
3) дисперсия случайной ошибки уравнения
регрессии является постоянной для всех
наблюдений:
4) случайные ошибки уравнения регрессии
не коррелированны между собой, т. е.
ковариация случайных ошибок любых двух
разных наблюдений равна нулю:
,где
i ≠j. Это предположение верно
в том случае, если изучаемые данные не
являются временными рядами;
5) основываясь на 3 и 4-м предположениях, добавляется условие о том, что случайная ошибка уравнения регрессии является случайной величиной, подчиняющейся нормальному закону распределения с нулевым математическим ожиданием.
Воздействие неучтенных случайных
факторов и ошибок наблюдений в модели
определяется с помощью дисперсии
возмущений (ошибок) или остаточной
дисперсии
.
Несмещенной оценкой этой дисперсии
является выборочная остаточная
дисперсия.
где
– значение, найденное по уравнению
регрессии;
– выборочная оценка возмущения
или остаток регрессии.
Оценкой модели по выборке является
уравнение регрессии
.
Параметры этого уравнения
и
определяются
на основе метода наименьших квадратов.
1
r=-1
r=1
r=0
r=0
r=-1
= 0, то значения, (xi, yi),
полученные из двумерной нормальной
совокупности, располагаются на графике
в координатах х, ув пределах области,
ограниченной окружностью. В этом случае
между случайными величинами Х и Y
отсутствует корреляция и они называются
некоррелированными. Для двумерного
нормального распределения некоррелированность
означает одновременно и независимость
случайных величин Х и Y. При этом
линия регрессии параллельна оси Ох.
2
r=1
,
то между случайными величинами Х и
Y существует линейная функциональная
зависимость. В этом случае говорят о
полной корреляции. При
= 1 значения xi, yi
определяют точки, лежащие на прямой
линии, имеющей положительный наклон (с
увеличением xi значения yi
также увеличиваются), при
= -1 прямая имеет отрицательный наклон.
3) В промежуточных случаях (-1 < < 1) точки, соответствующие значениям xi,yi, попадают в область, ограниченную некоторым эллипсом, причем при > 0 имеет место положительная корреляция (с увеличением xi значения yi имеют тенденцию к возрастанию), при < 0 корреляция отрицательная. Чем ближе к±1, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии.
r<0
r>0
4 ) Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию.
