Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по результатам.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
442.37 Кб
Скачать

Глава 3. Методы корреляционного и регрессионного анализа.

Методы регрессионного и корреляционного анализа широко применяются для выявления и описания зависимостей между случайными величинами по экспериментальным данным. Для экспериментального изучения зависимсти между случайными величинами X и Y проводят n независимых опытов,получают пары значений X ,Y . О наличии или отсутствии корреляции можно судить по виду поля корреляции, нанося точки X ,Y на координатную плоскость. (См. рис. 4 ) 1- положительная корреляция; 2- слабая отрицательная корреляция и 3-корреляция отсутствует.

Y Y Y

+ + + +

+ + + +

+ + + + +

+ + + + +

+ + +

+ + +

+

X X X 1) 2) 3)

Рис.4. Типы корреляционных зависимостей: 1-положительная корреляция; 2-слабая отрицательная корреляция; 3-отсутствие корреляции.

Для количественной оценки тесноты связи между X и Y служит вы-

борочный коэффициент корреляции:

R = [(xi -xcp)(yi -ycp)]/(n-1)SxSy -1R+1

Если R не равна нулю, то корреляция существует. Если R=1 или R= -1,

то имеет место зависимость

y = a + bx (R=1)

или

y= a - bx (R=-1)

Условное математическое ожидание величины Y при данном X

mx,y = my + R(y /x)(x-mx)

где my = ycp и mx = xcp

Это линейное уравнение называется регрессией Y на X.

Среднее квадратичное отклонение

y,x = y (1-R2 )

Коэффициент корреляции не изменяется при изменении начала отсче-

та и масштаба величин X и Y. Коэффициент корреляции отражает как

долю случайности, так и криволинейность связи между X и Y.

Для проверки гипотезы об отсутствии корреляции необходимо про-

верить, значимо ли отличаются R от нуля. Можно использовать нормальное распределение

R =(1-R2)/(n)1/2 .

Если доверительная вероятность равна 0,95, то коэффициент корреляции находится в пределах

R - 1,96(1-R)/(n)1/2  R  R + 1,96(1-R)/(n)

Таким образом, с вероятностью 0,95 можно утверждать, что зависимость между случайными величинами X и Y существует, если 0 не содержится внутpи доверительного интервала, то есть если

|R| = 1,96(1+R2)/(n)1/2 > 0

Если экспериментальных данных мало, то распределение коэффициентов корреляции отличается от нормального. При доверительной вероятности 0,95

Z-1,96/(n-3)1/2  mz  Z+1,96/(n+3)1/2

где mz - математическое ожидание Zcp

Z = (1/2)ln[(1+R)/(1-R)]

Для характеристики формы связи при изучении корреляционной зависимости пользуются уравнением приближенной регрессии.

Пример 7: По данной выборке объема n найти уравнение приближенной регрессии и оценить допускаемую при этом ошибку.

Уравнение приближенной регрессии существенно зависит от выбира-емого метода приближения. Обычно выбирают метод наименьших квадратов. Наилучшее приближение дает функция f(x), для которой сумма квадратов Ф имеет наименьшее значение:

Ф = (yi -f(xi))2 = min

Для определения уравнения регрессии, описывающего зависимость Y от X в виде полинома

Y=f(x,b0 ,b1 ,b2 ,b3 ...bk )

следует определить коэффициенты bk . Минимальное значение Ф будет при

dФ/db0 =0; dФ/db1 =0; . . . или 2[y-f(xi, ... )]df/db0 = 0

Можно также составить и решить систему уравнений

y(df/db0 ) - f(df/db0) = 0

...........

Система уравнений содержит столько же уравнений, сколько коэф-

фициентов bk .

Линейная регрессия от одного параметра

Методом наименьших квадратов найти уравнение вида Y=b +b X, наилучшим образом описыващую положительную регрессионную зависимость Y от X.

Для этого составляем систему уравнений:

yi - (b +b1X) = 0 Ф/b0 = (yi -(b0+b1xi)) = 0

xiyi - (b0+b1xi) =0 Ф/b1 = (yi -(b0+b1xi)xi ) = 0

После преобразований находим

b = [xiyi - Nxiyi ]/[ (xi)2-Nxi2]

b0 =Ycp-b1Xcp

Коэффициент корреляции рассчитываем по формуле

R = [(xi -xcp)(yi -ycp)]/(n-1)SxSy -1R+1

или

R=b1Sx/Sy = b1{[nxi2 -(xi)2 ]/[nyi2 -(yi)2 ]}1/2

Проверку вычислений проводят по формуле:

(xi+yi)2 = xi2 + 2xiyi + yi2

Качество аппроксимации оценивают, сравнивая S2ост и дисперсию относительно среднего

Sу2 = [(yi-Ycp)2]/(n-1)

S2ост = [(yin -Yicp)2]/( mi -L)

где L - число коэффициентов в уравнении регрессии.

Параболическая регрессия

Y=b0+b1X+b2X2

Система уравнений:

b0N + b1xi + b2xi2 = yi

b0xi + b1xi2 +b2xi3 =xiyi

b0xi2 + b1 xi3 +b2xi4 =xi2yi2

Трансцендентная регрессия

Задача решается заменой перемeнных. Пусть Y=b0b1x или Y=b0Xb1

- показательная функция или степенная функция. Они линеализируются

Лек.5 Стр.21

уравнением вида

lgY=lgb0 +Xlgb1 ;

lgY=lgb0 +b1lgX;

- 29 -

пусть lgY=Z; lgb0 =a0 ; lgb1 =a1 ; lgx=t

Z=a0 +a1 X и Z=a0 +b1t

Множественная корреляция

Ищут зависимость

Y = b0 + b1x1+ b2x2 + b3x3 +...+ bkxk

Сначала переходят от натурального масштаба к новому, проведя

нормирование

Yi0 =(yi -Ycp)/Sy ; Xij0 = (xij -Xj0 )/Sxj

где i = 1,2,3,...n; j = 1,2,3,..k;

и ищут коэффициенты уравнения

Y0 = a0 + a1x10 + a2x20 + a3x30 +...+ akxk0

Коэффициенты уравнения находят из условия

Ф/a1=1; Ф/a2=1; Ф/ak =1

Составляют систему нормализованных уравнений

a1(x1i0)2 + a2x1i0x2i0 + ...+ akx1i0xki0 =x10yi0

a1 (x2i0x2i0) + a2(x2i0)2 + ...+ak x2i0 xki0 =x2i0 yi0

........

a1xki0x1i0 + a2xki0x2i0 + ...+ak(xki0)2 =xki0yi0

Если умножить на 1/(n-1) и принять во внимание, что

[1/(1-n)] (xij2) = 1

получаем систему нормальных уравнений вида

a1rxkx1+ a2rxkx2 + ... + ak = ryxk

Далее можно рассчитать коэффициент множественной корреляции.

ПРИЛОЖЕНИЯ

х

Таблица 1. Функция Лапласа Ф(х)=[1(2)1/2 ]ехр(-х2/2) dх

o

х

Ф(х)

х

Ф(х)

х

Ф(х)

х

Ф(х)

0,00

0

0,70

0,2580

1,40

0,4192

2,10

0,4821

0,05

0,0199

0,75

0,2734

1,45

0,4265

2,20

0,4861

0,10

0,0398

0,80

0,2481

1,50

0,4332

2,30

0,4893

0,15

0,0596

0,85

0,3023

1,55

0,4394

2,40

0,4918

0,20

0,0793

0,90

0,3159

1,60

0,4452

2,50

0,4938

0,25

0,0987

0,95

0,3289

1,65

0,4505

2,60

0,4953

0,30

0,1179

1,00

0,3413

1,70

0,4554

2,70

0,4965

0,35

0,1368

1,05

0,3531

1,75

0,4599

2,80

0,4974

0,40

0,1554

1,10

0,3643

1,80

0,4641

2,90

0,4981

0,45

0,1736

1,15

0,3749

1,85

0,4678

3,00

0,49865

0,50

0,1915

1,20

0,3849

1,90

0,4713

3,20

0,49931

0,55

0,2088

1,25

0,3944

1,95

0,4744

3,40

0,49966

0,60

0,2257

1,30

0,4032

2,00

0,4783

3,60

0,49984

0,65

0,2422

1,35

0,4115

2,06

0,4803

4,00

0,499968

Таблица 2. Критерий Стьюдента t: Значения t при данном числе степеней свободы N и данной величине вероятности (уровне значимости) Р.

N

Р=

0,10

P=

=0,05

P=

=0,02

Р=

0,01

N

Р=

0,10

P=

=0,05

P=

=0,02

Р=

=0,01

1

6,31

12,704

31,821

63,7

11

1,80

2,201

2,718

3,11

2

2,92

4,303

6,965

9,93

12

1,78

2,179

2,681

3,06

3

2,35

3,182

4,541

5,84

13

1,77

2,160

2,650

3,01

4

2,13

2,778

3,747

4,60

14

1,76

2,145

2,624

2,98

5

2,02

2,571

3,365

4,03

15

1,75

2,131

2,602

2,95

6

1,94

2,447

3,143

3,71

16

1,75

2,120

2,583

2,92

7

1,90

2,365

2,998

3,50

17

1,74

2,110

2,567

2,90

8

1,86

2,306

2,896

3,36

20

1,73

2,086

2,528

2,85

9

1,83

2,262

2,821

3,25

25

1,71

2,060

2,485

2,79

10

1,81

2,288

2,764

3,17

30

1,70

2,042

2,457

2,75

- 31 -

Таблица 3.Критерий Фишера: значения F=S12/S22 при Р=0,05 N1- число степеней свободы (для числителя); N2- число степней свободы для знаменателя.

N2

N1=1

N1=3

N1=5

N1=20

1

161,4

215,70

230,2

2

18,51

19,16

19,30

19,4

3

10,13

9,28

9,01

8,66

4

7,71

6,59

6,26

5,80

5

6,61

5,41

5,05

4,56

7

5,59

4,35

3,97

3,44

8

5,32

4,07

3,69

3,15

9

5,12

3,86

3,48

2,94

10

4,96

3,71

3,33

2,77

12

3,49

3,00

2,54

Таблица 4. Критерий Пирсона (согласия) 2 : значения ,соответствующие значениям Р(2) и числам степеней свободы N.

N

Р=0,95

P=0,05

P=0,02

N

Р=0,95

P=0,05

P=0,02

1

0,0039

3,841

5,412

9

3,32

16,919

19,679

2

0,103

5,991

7,824

10

3,94

18,307

21,161

3

0,352

7,815

9,837

15

7,3

24,996

28,259

4

0,71

9,488

11,668

20

10,9

31,410

35,020

5

1,14

11,070

13,388

25

14,6

37,652

41,566

7

2,17

14,067

16,622

30

18,5

43,773

47,962

Литература

1. Ахназарова С.Л., Кафаров В.В. Методы оптимизации эксперимента в химической технологии.М.,Высщая школа, 1985 г.

2. Кафаров В.В. Методы кибернетики в химии и химической технологии.М.,Химия,1976 г.

3.Глудкин О.П. и др. Статистические методы в технологии производства РЭА, М.,Энергия,1977 г.

4. Джонсон Н.,Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы планирования эксперимента.М.,Мир,1981 г.

5.Адлер Ю.П., Маркова Е.В., Грановский Ю.В., Планирование эксперимента при поиске оптимальных условий.М.,Наука,1976 г.