Binder1
.pdf
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ˆ |
|
K* ( X ,Y ) |
|
|
XY X Y |
|
|
|||||||||||
|
b |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
2 |
|
, |
||
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
2 |
X |
|||||||||||||||
(11) |
|
|
|
|
SX |
|
|
X |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
aˆ |
b X , |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
SX2 |
|
|
|
|
|
2 |
|
|
|
|
|
X , |
|
||||||||
|
X 2 |
|
|
|
|
|
|
|||||||||||||||
где |
X |
— |
выборочная |
дисперсия |
переменной |
а |
||||||||||||||||
K* ( X ,Y ) |
|
|
|
|
|
|
— выборочная |
|
||||||||||||||
XY |
X |
Y |
ковариация или выборочный ковариационный |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ˆ |
|
|
оценками |
наименьших |
квадратов |
неизвестных |
|
момент. Статистики aˆ, b называются |
||||||||||||||||||||||
параметров a и b . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
Оценку функции регрессии (эмпирическую регрессию, выборочную регрессию, |
|||||||||||||||||||||
линейное уравнение регрессии Y по X ) определяют соотношения: |
|
|
||||||||||||||||||||
|
|
|
|
|
|
ˆ |
|
|
|
|
|
|
ˆ |
|
|
|
|
|
|
|
||
|
(12) |
|
|
|
|
Y |
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
YX |
b X X |
|
|
|
|
|
|||||||||||
|
(13) |
|
|
|
|
ˆ |
aˆ |
ˆ |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
YX |
bX . |
|
|
|
|
|
|
|
Линия регрессии всегда проходит через точку X ,Y . Коэффициент b — есть угловой
коэффициент регрессии. Его также называют коэффициентом прямой регрессии Y по X . Он показывает, на сколько единиц в среднем изменится переменная Y при увеличении независимой переменной X на единицу.
Постоянная a дает оценку среднего значения зависимой переменной при X 0. Эта интерпретация возможна или невозможна в зависимости от того, насколько далеко находится X 0 от выборочных значений X .
Пример 3. Распределение 5 предприятий по фондовооруженности (в млн. руб.) и энерговооруженности (в млн. квт-ч.) представлено в таблице.
№ предприятия |
1 |
2 |
3 |
4 |
Энерговооруженность (X) |
3 |
2 |
1 |
2 |
Фондовооруженность (Y) |
4 |
6 |
2 |
8 |
Найдите выборочный коэффициент корреляции и сделайте вывод о наличии линейной зависимости между фондо- и энерговооруженностью. Постройте выборочное уравнение прямой регрессии, описывающей влияние энерговооруженности на фондовооруженность. Дать интерпретацию ее коэффициентов.
Решение. Вычислим сначала вспомогательные суммы
4 |
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|||||||
yi |
|
20, |
|
|
|
|
xi |
8, |
xi yi 42, |
|
|
|
xi2 |
18 , |
|
|||||||||||||||||||||||
|
i 1 |
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
||||||||
а затем необходимые выборочные характеристики |
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
xi |
8 |
2, |
|
|
|
yi |
|
|
20 |
|
5, |
|
|
|
|
|
|
|
|
||||||||||||||
|
X |
|
i 1 |
|
|
Y |
|
i 1 |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
n |
|
4 |
|
n |
4 |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi yi |
|
|
|
|
42 |
|
|
|
|
|
|
|
|
xi2 |
18 |
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
10, 5, |
|
X 2 |
|
|
i 1 |
|
|
|
|
4, 5, |
|
|
|||||||||||||
|
XY |
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
n |
|
4 |
|
n |
|
|
|
4 |
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
S 2 |
X 2 |
|
|
)2 |
4, 5 (2)2 0,5, |
S 2 |
Y 2 |
|
|
|
)2 |
30 (5)2 |
5. |
||||||||||||||||||||||||
|
( X |
(Y |
||||||||||||||||||||||||||||||||||||
|
|
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|
Теперь найдем коэффициент корреляции:
1. Общая линейная модель наблюдений
Имеются y1, , yn – результаты наблюдений случайной переменной Y . Предполагаем,
что они допускают представление в виде соотношений: |
|
||
(1) |
yi b0 xi 0 b1xi1 b2 xi 2 bk xik i , |
i 1 n, |
|
где xi, j |
– заданный набор значений, bi – неизвестные параметры, |
а i – некоторые |
случайные ошибки. Тогда совокупность соотношений (1) называют общей линейной моделью наблюдений.
В этой модели либо xi 0 0 (свободный член в модели отсутствует), либо xi 0 1(свободный член – пересечение в модели есть).
Пример 1 (множественная линейная регрессионная модель). Если значение случайной
переменной |
Y объясняется значениями k переменными |
X1, , X k посредством |
|
соотношения |
|
||
|
(2) |
Y b0 b1 X1 bk X k , |
с k факторами. Здесь |
то |
говорят |
о модели множественной линейной регрессии |
|
b0 , |
b1, , |
bk – неизвестные параметры модели, – случайная ошибка (возмущение) |
модели. В модели возможно отсутствие свободного члена, т.е. b0 0 . Исходными данными для модели (2) являются результаты n наблюдений переменных X1, , X k ,Y :
xi,1, , xi,k , yi , |
i 1, 2, , n. При этом xi, j |
– результат i -го наблюдения переменной X j ; |
yi – результат |
i -го наблюдения переменной Y . Естественно считать, что результаты |
|
наблюдений удовлетворяют (2). Поэтому справедливы соотношения |
||
(3) yi b0 |
b1xi1 b2 xi 2 bk xik i , |
i 1 n, |
которые называют множественной линейной регрессионной моделью наблюдений. |
||
Нетрудно видеть идентичность (2) и (3). |
Различие в том, что элементы xi, j общей |
линейной модели могут иметь и другую интерпретацию.
Более удобная форма записи модели (1) – ее матричный вариант
(4)Y = X + ,
|
y1, , yn |
T |
– вектор-столбец значений зависимой переменной, |
b0 , ,bk |
T |
– |
|||
где Y |
|
|
|||||||
вектор-столбец неизвестных параметров, |
X – матрица данных. |
|
|
|
|||||
В модели (3) матрица данных принимает вид |
|
|
|
|
|||||
|
|
|
1 |
x11 |
x1k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
1 |
x21 |
x2k . |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
1 |
xn1 |
|
|
|
|
|
|
|
|
xnk |
|
|
|
В этом случае m – количество неизвестных коэффициентов модели равно m k 1.
Количество наблюдений |
|
|
|
|
|
11 |
|
1 |
2,1 |
11 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
n 12. |
|
|
|
|
|
|
13 |
|
1 |
2,2 |
11 |
|
||||
|
|
|
|
|
|
|
16 |
|
1 |
2,3 |
12 |
|
||||
|
|
|
|
|
|
|
|
24 |
|
|
2,4 |
13 |
|
|||
Если переменные Y , |
X1 |
и |
X 2 |
связаны |
|
|
|
1 |
|
|||||||
|
|
24 |
|
1 |
2,5 |
15 |
|
|||||||||
соотношением Y b0 b1 X1 |
b2 X 2 |
, |
|
|||||||||||||
|
|
26 |
|
|
2,5 |
17 |
|
|||||||||
|
|
|
|
|
|
|
|
1 |
|
|||||||
то вектор значений Y и матрица данных X |
Y |
27 |
, |
X 1 |
2,6 |
17 |
|
|||||||||
имеют вид |
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
2,7 |
18 |
|
||
|
|
|
|
|
|
|
28 |
|
1 |
|
||||||
|
|
|
|
|
|
|
|
29 |
|
|
2,6 |
18 |
|
|||
|
|
|
|
|
|
|
|
|
1 |
|
||||||
|
|
|
|
|
|
|
33 |
|
1 |
2,7 |
19 |
|
||||
|
|
|
|
|
|
|
|
33 |
|
|
2,7 |
19 |
|
|||
|
|
|
|
|
|
|
|
|
1 |
|
||||||
|
|
|
|
|
|
|
|
36 |
|
|
2,7 |
22 |
|
|||
|
|
|
|
|
|
|
|
|
1 |
|
||||||
|
|
|
|
|
|
|
11 |
|
|
2,1 |
11 |
|
||||
Количество наблюдений |
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
n 12. |
|
|
|
|
|
|
13 |
|
|
2,2 |
11 |
|
||||
|
|
|
|
|
|
|
16 |
|
|
2,3 |
12 |
|
||||
|
|
|
|
|
|
|
|
24 |
|
|
2,4 |
13 |
|
|||
Если переменные Y , |
X1 и |
X 2 связаны |
|
|
|
|
|
|
||||||||
|
|
|
24 |
|
|
2,5 |
15 |
|
||||||||
соотношением Y b1 X1 |
b2 X 2 |
, |
|
|
|
|||||||||||
|
|
|
|
26 |
|
|
2,5 |
17 |
|
|||||||
|
и матрица данных |
|
|
|
|
|
||||||||||
то вектор значений Y |
|
Y |
27 |
, |
X |
2,6 |
17 |
|
||||||||
X имеют вид |
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
2,7 |
18 |
|
||
|
|
|
|
|
|
|
28 |
|
|
|
||||||
|
|
|
|
|
|
|
|
29 |
|
|
2,6 |
18 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
33 |
|
|
2,7 |
19 |
|
||||
|
|
|
|
|
|
|
|
33 |
|
|
2,7 |
19 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
36 |
|
|
2,7 |
22 |
|
|||
|
|
|
|
|
|
|
|
|
|
|