- •Рассмотрим систему СВ (Х,У).
- •По свойству математического ожидания:
- •Отсюда получаем систему:
- •Отсюда:
- •и искомая линейная зависимость имеет вид:
- •При этих значениях a и b функция F(a,b) называется ошибкой приближения φ(х) и
- •Сприближением kXY
- •Это позволяет использовать разность Y2| X k 2 XY
- •Решение этой системы запишется в виде:
- •Найти оценки параметров линейной регрессии по выборке
- •Уравнение искомой прямой
- •Найдем средние величины:
Рассмотрим систему СВ (Х,У). |
|
Подберем линейную зависимость |
|
y bx a (x) |
|
так, чтобы функция |
|
F(a,b) M[(Y a bX )2 ] |
|
была минимальна. Имеем: |
|
F(a, b) M[Y 2 2aY 2bXY a2 |
2abX b2 X 2 ] |
По свойству математического ожидания:
M[Y 2 ] 2a M[Y ] 2b M[ XY ] a22a b M[ X ] b2 M[ X 2 ]
Дифференцируем это выражение по а и b и приравниваем производные к нулю:
F(a, b) 2M[Y ] 2a 2bM[ X ] 0
a
F(a,b) 2M[ XY ] 2aM[ X ] 2bM[ X 2 ] 0
b
Отсюда получаем систему:
a b M[ X ] M[Y ]
a M[ X ] b M[ X 2 ] M[ XY ]
Решаем:
a M[Y ] b M[ X ]
M[Y ] M[ X ] b(M[ X 2 ])2 bM[ X 2 ] M[ XY]
Отсюда:
b M[ X 2 ] M 2[ X ] M[ XY] M[Y ] M[ X ]
|
|
|
|
|
b M[ XY ] M[Y ] M[ X ] |
KXY |
|
|
M[ X 2 ] (M[ X 2 ])2 |
Dx |
|
|
|
|
|
Тогда
a M[Y ] KXY M[ X ] Dx
и искомая линейная зависимость имеет вид:
y (x) M[Y] KXY M[ X ] x KXY Dx Dx
M[Y] (x M[ X ]) KXY
Dx
Учтем, что KXY kXY x y
Тогда |
y (x) my (x mx ) kXY y |
|
x |
При этих значениях a и b функция F(a,b) называется ошибкой приближения φ(х) и равна
F(a, b) M[(Y ( X ))2 ] y2 (1 kXY )
Ошибкой регрессии будет величина
M[M[Y | X ] ( X ))2 ] y2 ( Y2| X k2 XY )
Сприближением kXY
кединице, уменьшается ошибка приближения или возрастает концентрация значений (Х,У). около прямой линии, определяемой уравнением
y my (x mx ) kXY y
С приближением kXY x
к корреляционному отношению, уменьшается ошибка регрессии, или неизвестная функция регрессии приближается к линейной функции.
Верно и обратное утверждение.
Это позволяет использовать разность Y2| X k 2 XY
в качестве меры отклонения функции регрессии от линейной зависимости.
На практике известны только результаты наблюдений (т.е. пары значений (Х,У)), поэтому все рассмотренные величины заменяются своими выборочными аналогами.
Тогда исходная система уравнений будет иметь вид
a bX Y aX bX XY
Решение этой системы запишется в виде:
a Y KXY X S 2 x
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
XY |
|||||||||||
|
b |
Y |
X |
KXY |
|
|||||||
|
|
|
|
|
|
|
|
|||||
|
|
|
X 2 ( |
|
)2 |
S 2 x |
|
|||||
|
|
|
X |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
где KXY |
- |
выборочный |
аналог |
|
|
корреляционного момента; |
|
Sx2 |
- выборочный аналог дисперсии. |
Найти оценки параметров линейной регрессии по выборке
(9;6), (10;4), (12;7), (5;3). Изобразить заданные точки и прямую регрессии.