Формулы МС
.pdfОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА
Предмет регрессионного анализа – математическое описание зависимостей между изучаемыми случайными величинами после обнаружения стохастических связей между ними.
Уравнение регрессии Y на X :
M (Y x) = f (x),
условное математическое ожидание M (Y x ) является функцией x . Функция f (x) называется функцией регрессии Y на X , а ее график – линией регрессии.
Выборочный аналог этого уравнения, yx = f * (x), называется выборочным уравнением регрессии Y на X , функция f * (x) – выборочной функцией
регрессии Y на X , ее график – выборочной линией регрессии Y на X .
Аналогично определяются выборочные характеристики и для регрессии
X на Y .
|
|
|
|
|
|
|
Можно также составить условные законы распределения, например, Y |
||||||||||||||
при X = x j |
или Х при Y = yi . |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
|
x =x j |
|
|
|
y1 |
|
y2 |
|
… |
yl |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
m1 j |
|
m2 j |
|
… |
mlj |
||||||
|
|
|
|
|
|
|
Зная условные законы распределения, можно найти условные средние: |
||||||||||||||
|
|
|
|
|
, |
|
|
|
|
,..., |
|
|
|
и т.п Построим в системе координат(ХОY) точки |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
Y |
x=x1 |
Y |
x=x2 |
Y |
x =xk |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
æ |
|
|
|
|
|
|
ö |
и соединим их отрезками прямых. Полученную ломаную называют |
|||||||||||||
|
|
,Y |
|
||||||||||||||||||
ç x j |
|
|
÷ |
||||||||||||||||||
è |
|
|
|
|
|
|
x = x j ø |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
выборочной линией регрессии Y на X . Аналогично можно построить выборочную линию регрессии X на Y .
215
Линейная регрессия
Линейная регрессия заслуживает внимания по нескольким причинам:
1.Для двумерной случайной величины (Х,Y), распределенной по нормальному закону, регрессии составляющих линейны.
2.Нелинейную регрессию при определенных условиях можно аппроксимировать кусочно - линейной.
Нелинейную зависимость путем замены переменной можно свести к линейной.
При рассмотрении систем случайных величин были получены уравнения прямых среднеквадратической линейной регрессии:
y = my + r s y (x - mx ) sx
– прямая среднеквадратической регрессии Y на X ,
x = mx + r sx (y - my ) s y
– прямая среднеквадратической регрессии X на Y .
Здесь mx , my – средние значения, s x , s y – среднеквадратические откло-
нения, r – коэффициент корреляции. Поскольку мы имеем только данные выборки, эти величины должны быть вычислены по выборке:
y = Y B + rXY* sY (x - X B )
sX
– прямая выборочной среднеквадратической линейной регрессии Y на X ,
x = X B + rXY* sX (y -Y B )
sY
– прямая выборочной среднеквадратической линейной регрессии X на Y .
Если распределения случайных величин X и (или) Y заданы интервальным вариационным рядом, то удобно перейти к вспомогательным переменным, значения которых совпадают с серединами интервалов.
216