Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4сем / ПП_4_сем_pdf / Лаб_раб_1_Линейная_регрессия

.pdf
Скачиваний:
35
Добавлен:
23.02.2015
Размер:
159.35 Кб
Скачать

ПП 13.

ЛАБОРАТОРНАЯ РАБОТА 1: ЛИНЕЙНАЯ РЕГРЕССИЯ

Для каждого из четырех приведенных в таблице наборов данных (Xi ,Yi ) проделайте следующие действия.

1.Найдите числовые характеристики выборок.

2.Напишите уравнения линейной регрессии Y на X и X на Y .

3.Постройте диаграммы рассеяния, проведите прямые линейной регрессии.

 

 

 

 

№ п/п

 

 

X1

 

 

 

 

 

 

 

Y1

 

X 2

 

 

 

Y2

 

X3

 

 

Y3

 

X 4

 

Y4

 

 

 

 

 

 

1

 

 

 

 

 

 

10

 

 

 

8,040

 

10

 

 

 

9,140

 

10

 

7,460

 

 

 

8

 

 

5,210

 

 

 

 

 

 

 

2

 

 

 

 

 

 

8

 

 

 

6,950

 

8

 

 

 

 

8,170

 

8

 

 

6,760

 

 

 

8

 

 

6,050

 

 

 

 

 

 

 

3

 

 

 

 

 

 

13

 

 

 

7,580

 

13

 

 

 

8,740

 

13

 

12,750

 

 

 

8

 

 

6,750

 

 

 

 

 

 

 

4

 

 

 

 

 

 

9

 

 

 

8,820

 

9

 

 

 

 

8,770

 

9

 

 

7,110

 

 

 

8

 

 

6,245

 

 

 

 

 

 

 

5

 

 

 

 

 

 

11

 

 

 

8,330

 

11

 

 

 

9,260

 

11

 

7,810

 

 

 

8

 

 

8,465

 

 

 

 

 

 

 

6

 

 

 

 

 

 

14

 

 

 

9,960

 

14

 

 

 

8,100

 

14

 

8,840

 

 

 

8

 

 

5,970

 

 

 

 

 

 

 

7

 

 

 

 

 

 

6

 

 

 

7,240

 

6

 

 

 

 

6,110

 

6

 

 

6,100

 

 

19

 

12,495

 

 

 

 

 

 

 

8

 

 

 

 

 

 

4

 

 

 

4,260

 

4

 

 

 

 

3,119

 

4

 

 

5,390

 

 

 

8

 

 

8,790

 

 

 

 

 

 

 

9

 

 

 

 

 

 

12

 

 

 

10,830

 

12

 

 

 

9,135

 

12

 

8,140

 

 

 

8

 

 

8,260

 

 

 

 

 

 

 

10

 

 

 

 

7

 

 

 

4,810

 

7

 

 

 

 

7,220

 

7

 

 

6,420

 

 

 

8

 

 

6,370

 

 

 

 

 

 

 

11

 

 

 

 

5

 

 

 

5,680

 

5

 

 

 

 

4,735

 

5

 

 

5,730

 

 

 

8

 

 

7,890

 

 

Средние

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

x1,i =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

X

1 =

 

9 = X

2 = X3 = X 4 ,

Y1 =

 

y1,i = 7,500 =Y2

=Y3 =Y4 .

 

 

 

 

 

 

 

 

 

 

 

 

11 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

11

(x1,i X

1 )2 =10 = DX 2 = DX3 = DX 4 ,

 

 

 

 

 

 

 

 

 

 

 

 

DX1 =

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DY1 =

i=1 (y1,i

 

 

 

)2 3,753,

DY2 3,752 ,

 

DY3 3,752 ,

DY4 3,761.

Y1

 

11

 

Ковариации

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

KX1Y1

=

 

∑(x1,i X

1 )(y1,i

 

 

 

)5,000 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

KX Y

 

5,005 , KX Y 4,994 , KX Y 4,995.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

3

3

 

 

 

 

 

 

 

 

 

 

4

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты корреляции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

=

 

 

 

 

 

 

KX Y

 

 

 

0,816 , r

 

0,817 , r

 

0,815 ,

r

 

0,815 .

 

 

 

 

 

 

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X Y

 

 

 

 

 

 

DX1

DY1

 

 

 

 

 

 

 

 

X Y

 

 

 

 

 

 

 

X Y

 

 

X Y

 

 

 

 

 

 

 

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

3

3

 

 

4

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочная линейная регрессия Y на X по выборке (xi , yi ), i =1,2,...n , определяется уравнением

 

 

 

 

 

 

+rXY

DY

(x X

),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y = β0 + β1x =Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DX

 

 

 

 

 

 

 

 

KXY

 

 

 

 

 

 

 

 

 

 

 

где выборочные коэффициенты регрессии

 

β =

 

,

β

 

 

 

 

 

 

 

 

 

 

 

0

=Y β X

.

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

DX

 

 

1

 

 

 

Аналогично определяется выборочная линейная регрессия X на Y :

 

 

 

 

+rXY

DX

(y Y

),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x = β0′ + β1y = X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DY

 

 

 

 

 

 

 

 

KXY

 

 

 

 

 

 

 

 

 

 

 

где выборочные коэффициенты регрессии

 

 

 

=

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β1

 

DY

β0

= X β1Y .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β1

0,500

 

0,500

 

0,499

 

 

0,500

 

 

 

 

 

 

 

 

 

 

 

β0

3,000

 

2,996

 

3,007

 

 

3,004

 

 

 

 

 

 

 

 

 

 

 

β1

1,332

 

1,334

 

1,331

 

 

1,328

 

 

 

 

 

 

 

 

 

 

 

β0

-0,991

 

-1,004

-0,982

 

-0,960

 

 

 

 

 

 

 

 

 

 

Сплошная прямая – регрессия Y на X , штриховая – регрессия X на Y .

Как видно из диаграмм рассеяния и графиков линейной регрессии, приближенное описание реальной стохастической связи между переменными линейной функциональной связью не всегда верно.

Так, в случаях 3 и 4, скорее всего, имеет место нарушение статистической однородности условий опыта: одна из точек явно выпадает из общего массива; реальная зависимость между компонентами – линейная, но уравнение, определяющее эту зависимость, отличается от уравнения линейной регрессии.

Для случая 3 отличия невелики и полученное уравнение линейной регрессии обладает некоторой предсказательной силой, тогда как в случае 4 подобное использование уравнения линейной регрессии приведет к существенным ошибкам.

В случае 2 реальная связь между компонентами – квадратичная. Как и в случае 4, экстраполяция с помощью уравнения линейной регрессии приведет к существенным ошибкам.

Таким образом, решению задач регрессионного анализа должен предшествовать корреляционный анализ (при небольших объемах выборок он может быть выполнен графически – посредством построения диаграммы рассеяния).