4сем / ПП_4_сем_pdf / Лаб_раб_1_Линейная_регрессия
.pdfПП 13.
ЛАБОРАТОРНАЯ РАБОТА 1: ЛИНЕЙНАЯ РЕГРЕССИЯ
Для каждого из четырех приведенных в таблице наборов данных (Xi ,Yi ) проделайте следующие действия.
1.Найдите числовые характеристики выборок.
2.Напишите уравнения линейной регрессии Y на X и X на Y .
3.Постройте диаграммы рассеяния, проведите прямые линейной регрессии.
|
|
|
|
№ п/п |
|
|
X1 |
|
|
|
|
|
|
|
Y1 |
|
X 2 |
|
|
|
Y2 |
|
X3 |
|
|
Y3 |
|
X 4 |
|
Y4 |
|
||||||||||||||||||||||
|
|
|
|
|
1 |
|
|
|
|
|
|
10 |
|
|
|
8,040 |
|
10 |
|
|
|
9,140 |
|
10 |
|
7,460 |
|
|
|
8 |
|
|
5,210 |
|
|
||||||||||||||||||
|
|
|
|
|
2 |
|
|
|
|
|
|
8 |
|
|
|
6,950 |
|
8 |
|
|
|
|
8,170 |
|
8 |
|
|
6,760 |
|
|
|
8 |
|
|
6,050 |
|
|
||||||||||||||||
|
|
|
|
|
3 |
|
|
|
|
|
|
13 |
|
|
|
7,580 |
|
13 |
|
|
|
8,740 |
|
13 |
|
12,750 |
|
|
|
8 |
|
|
6,750 |
|
|
||||||||||||||||||
|
|
|
|
|
4 |
|
|
|
|
|
|
9 |
|
|
|
8,820 |
|
9 |
|
|
|
|
8,770 |
|
9 |
|
|
7,110 |
|
|
|
8 |
|
|
6,245 |
|
|
||||||||||||||||
|
|
|
|
|
5 |
|
|
|
|
|
|
11 |
|
|
|
8,330 |
|
11 |
|
|
|
9,260 |
|
11 |
|
7,810 |
|
|
|
8 |
|
|
8,465 |
|
|
||||||||||||||||||
|
|
|
|
|
6 |
|
|
|
|
|
|
14 |
|
|
|
9,960 |
|
14 |
|
|
|
8,100 |
|
14 |
|
8,840 |
|
|
|
8 |
|
|
5,970 |
|
|
||||||||||||||||||
|
|
|
|
|
7 |
|
|
|
|
|
|
6 |
|
|
|
7,240 |
|
6 |
|
|
|
|
6,110 |
|
6 |
|
|
6,100 |
|
|
19 |
|
12,495 |
|
|
||||||||||||||||||
|
|
|
|
|
8 |
|
|
|
|
|
|
4 |
|
|
|
4,260 |
|
4 |
|
|
|
|
3,119 |
|
4 |
|
|
5,390 |
|
|
|
8 |
|
|
8,790 |
|
|
||||||||||||||||
|
|
|
|
|
9 |
|
|
|
|
|
|
12 |
|
|
|
10,830 |
|
12 |
|
|
|
9,135 |
|
12 |
|
8,140 |
|
|
|
8 |
|
|
8,260 |
|
|
||||||||||||||||||
|
|
|
|
|
10 |
|
|
|
|
7 |
|
|
|
4,810 |
|
7 |
|
|
|
|
7,220 |
|
7 |
|
|
6,420 |
|
|
|
8 |
|
|
6,370 |
|
|
||||||||||||||||||
|
|
|
|
|
11 |
|
|
|
|
5 |
|
|
|
5,680 |
|
5 |
|
|
|
|
4,735 |
|
5 |
|
|
5,730 |
|
|
|
8 |
|
|
7,890 |
|
|
||||||||||||||||||
Средние |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
1 |
|
|
∑x1,i = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|||||||||||||||||||
X |
1 = |
|
9 = X |
2 = X3 = X 4 , |
Y1 = |
|
∑y1,i = 7,500 =Y2 |
=Y3 =Y4 . |
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
11 i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
Дисперсии |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
1 |
|
11 |
(x1,i − X |
1 )2 =10 = DX 2 = DX3 = DX 4 , |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
DX1 = |
|
∑i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
11 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
1 |
|
|
11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
DY1 = |
∑i=1 (y1,i |
|
|
|
)2 ≈3,753, |
DY2 ≈3,752 , |
|
DY3 ≈ 3,752 , |
DY4 ≈3,761. |
||||||||||||||||||||||||||||||||||||||||||||
−Y1 |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
11 |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
Ковариации |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
1 |
|
11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
KX1Y1 |
= |
|
∑(x1,i − X |
1 )(y1,i |
|
|
|
)≈5,000 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
−Y1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
11 i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
KX Y |
|
≈5,005 , KX Y ≈ 4,994 , KX Y ≈ 4,995. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
3 |
3 |
|
|
|
|
|
|
|
|
|
|
4 |
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Коэффициенты корреляции |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
r |
= |
|
|
|
|
|
|
KX Y |
|
|
|
≈ 0,816 , r |
|
≈0,817 , r |
|
≈0,815 , |
r |
|
≈0,815 . |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
1 1 |
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
X Y |
|
|
|
|
|
|
DX1 |
DY1 |
|
|
|
|
|
|
|
|
X Y |
|
|
|
|
|
|
|
X Y |
|
|
X Y |
|
|
|
|
|
|
|
|
|
|||||||||||||||
1 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
2 |
|
|
|
|
|
3 |
3 |
|
|
4 |
4 |
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Выборочная линейная регрессия Y на X по выборке (xi , yi ), i =1,2,...n , определяется уравнением
|
|
|
|
|
|
+rXY |
DY |
(x − X |
), |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
y = β0 + β1x =Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
DX |
|
|
|
|
|
|
|
|
KXY |
|
|
|
|
|
|
|
|
|
|
|
где выборочные коэффициенты регрессии |
|
β = |
|
, |
β |
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
0 |
=Y −β X |
. |
||||||||||||||||||||||||
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
DX |
|
|
1 |
|
|
|
||||||||
Аналогично определяется выборочная линейная регрессия X на Y : |
||||||||||||||||||||||||||||
|
|
|
|
+rXY |
DX |
(y −Y |
), |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
x = β0′ + β1′y = X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
DY |
|
|
|
|
|
|
|
|
KXY |
|
|
|
|
|
|
|
|
|
|
|
где выборочные коэффициенты регрессии |
|
|
|
′ |
= |
|
, |
|
′ |
|
|
|
|
′ |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
β1 |
|
DY |
β0 |
= X −β1Y . |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
β1 |
0,500 |
|
0,500 |
|
0,499 |
|
|
0,500 |
|
|
|
|
|
|
|
|
|
|
|||||||||
|
β0 |
3,000 |
|
2,996 |
|
3,007 |
|
|
3,004 |
|
|
|
|
|
|
|
|
|
|
|||||||||
|
β1′ |
1,332 |
|
1,334 |
|
1,331 |
|
|
1,328 |
|
|
|
|
|
|
|
|
|
|
|||||||||
|
β0′ |
-0,991 |
|
-1,004 |
-0,982 |
|
-0,960 |
|
|
|
|
|
|
|
|
|
|
Сплошная прямая – регрессия Y на X , штриховая – регрессия X на Y .
Как видно из диаграмм рассеяния и графиков линейной регрессии, приближенное описание реальной стохастической связи между переменными линейной функциональной связью не всегда верно.
Так, в случаях 3 и 4, скорее всего, имеет место нарушение статистической однородности условий опыта: одна из точек явно выпадает из общего массива; реальная зависимость между компонентами – линейная, но уравнение, определяющее эту зависимость, отличается от уравнения линейной регрессии.
Для случая 3 отличия невелики и полученное уравнение линейной регрессии обладает некоторой предсказательной силой, тогда как в случае 4 подобное использование уравнения линейной регрессии приведет к существенным ошибкам.
В случае 2 реальная связь между компонентами – квадратичная. Как и в случае 4, экстраполяция с помощью уравнения линейной регрессии приведет к существенным ошибкам.
Таким образом, решению задач регрессионного анализа должен предшествовать корреляционный анализ (при небольших объемах выборок он может быть выполнен графически – посредством построения диаграммы рассеяния).