
- •Глава 1. Представление результатов экспериментов.
- •Лекция 2. Пример обработки результатов. Функция желательности.
- •Использование критерия Стьюдента.
- •Понятие целевой обобщенной функции, функция желательности.
- •Функция желательности
- •Пример.
- •Решение задач о погрешностях.
- •Глава 3. Методы корреляционного и регрессионного анализа.
- •Приложение 1. Требования к качеству экспериментов для возможности их планирования.
- •Практическое занятие 4
- •Практическое занятие 5.
- •Практическое занятие 7.
- •Приложении 3. Описание лабораторных работ
- •1.Теоретичекая часть.
- •X13,y23. (Рис.1) После нахождения значений функции во всех трех точках
- •2. Порядок выполнения работы.
- •3. Сдача зачета по лабораторной работе.
- •1.Теоретическая часть.
Глава 3. Методы корреляционного и регрессионного анализа.
Методы регрессионного и корреляционного анализа широко применяются для выявления и описания зависимостей между случайными величинами по экспериментальным данным. Для экспериментального изучения зависимсти между случайными величинами X и Y проводят n независимых опытов,получают пары значений X ,Y . О наличии или отсутствии корреляции можно судить по виду поля корреляции, нанося точки X ,Y на координатную плоскость. (См. рис. 4 ) 1- положительная корреляция; 2- слабая отрицательная корреляция и 3-корреляция отсутствует.
Y
Y
Y
+ +
+ +
+ + + +
+ + + + +
+ + + + +
+ + +
+ + +
+
X
X
X
1)
2) 3)
Рис.4. Типы корреляционных зависимостей: 1-положительная корреляция; 2-слабая отрицательная корреляция; 3-отсутствие корреляции.
Для количественной оценки тесноты связи между X и Y служит вы-
борочный коэффициент корреляции:
R = [(xi -xcp)(yi -ycp)]/(n-1)SxSy -1R+1
Если R не равна нулю, то корреляция существует. Если R=1 или R= -1,
то имеет место зависимость
y = a + bx (R=1)
или
y= a - bx (R=-1)
Условное математическое ожидание величины Y при данном X
mx,y = my + R(y /x)(x-mx)
где my = ycp и mx = xcp
Это линейное уравнение называется регрессией Y на X.
Среднее квадратичное отклонение
y,x = y (1-R2 )
Коэффициент корреляции не изменяется при изменении начала отсче-
та и масштаба величин X и Y. Коэффициент корреляции отражает как
долю случайности, так и криволинейность связи между X и Y.
Для проверки гипотезы об отсутствии корреляции необходимо про-
верить, значимо ли отличаются R от нуля. Можно использовать нормальное распределение
R =(1-R2)/(n)1/2 .
Если доверительная вероятность равна 0,95, то коэффициент корреляции находится в пределах
R - 1,96(1-R)/(n)1/2 R R + 1,96(1-R)/(n)
Таким образом, с вероятностью 0,95 можно утверждать, что зависимость между случайными величинами X и Y существует, если 0 не содержится внутpи доверительного интервала, то есть если
|R| = 1,96(1+R2)/(n)1/2 > 0
Если экспериментальных данных мало, то распределение коэффициентов корреляции отличается от нормального. При доверительной вероятности 0,95
Z-1,96/(n-3)1/2 mz Z+1,96/(n+3)1/2
где mz - математическое ожидание Zcp
Z = (1/2)ln[(1+R)/(1-R)]
Для характеристики формы связи при изучении корреляционной зависимости пользуются уравнением приближенной регрессии.
Пример 7: По данной выборке объема n найти уравнение приближенной регрессии и оценить допускаемую при этом ошибку.
Уравнение приближенной регрессии существенно зависит от выбира-емого метода приближения. Обычно выбирают метод наименьших квадратов. Наилучшее приближение дает функция f(x), для которой сумма квадратов Ф имеет наименьшее значение:
Ф = (yi -f(xi))2 = min
Для определения уравнения регрессии, описывающего зависимость Y от X в виде полинома
Y=f(x,b0 ,b1 ,b2 ,b3 ...bk )
следует определить коэффициенты bk . Минимальное значение Ф будет при
dФ/db0 =0; dФ/db1 =0; . . . или 2[y-f(xi, ... )]df/db0 = 0
Можно также составить и решить систему уравнений
y(df/db0 ) - f(df/db0) = 0
...........
Система уравнений содержит столько же уравнений, сколько коэф-
фициентов bk .
Линейная регрессия от одного параметра
Методом наименьших квадратов найти уравнение вида Y=b +b X, наилучшим образом описыващую положительную регрессионную зависимость Y от X.
Для этого составляем систему уравнений:
yi - (b +b1X) = 0 Ф/b0 = (yi -(b0+b1xi)) = 0
xiyi - (b0+b1xi) =0 Ф/b1 = (yi -(b0+b1xi)xi ) = 0
После преобразований находим
b = [xiyi - Nxiyi ]/[ (xi)2-Nxi2]
b0 =Ycp-b1Xcp
Коэффициент корреляции рассчитываем по формуле
R = [(xi -xcp)(yi -ycp)]/(n-1)SxSy -1R+1
или
R=b1Sx/Sy = b1{[nxi2 -(xi)2 ]/[nyi2 -(yi)2 ]}1/2
Проверку вычислений проводят по формуле:
(xi+yi)2 = xi2 + 2xiyi + yi2
Качество аппроксимации оценивают, сравнивая S2ост и дисперсию относительно среднего
Sу2 = [(yi-Ycp)2]/(n-1)
S2ост = [(yin -Yicp)2]/( mi -L)
где L - число коэффициентов в уравнении регрессии.
Параболическая регрессия
Y=b0+b1X+b2X2
Система уравнений:
b0N + b1xi + b2xi2 = yi
b0xi + b1xi2 +b2xi3 =xiyi
b0xi2 + b1 xi3 +b2xi4 =xi2yi2
Трансцендентная регрессия
Задача решается заменой перемeнных. Пусть Y=b0b1x или Y=b0Xb1
- показательная функция или степенная функция. Они линеализируются
Лек.5 Стр.21
уравнением вида
lgY=lgb0 +Xlgb1 ;
lgY=lgb0 +b1lgX;
- 29 -
пусть lgY=Z; lgb0 =a0 ; lgb1 =a1 ; lgx=t
Z=a0 +a1 X и Z=a0 +b1t
Множественная корреляция
Ищут зависимость
Y = b0 + b1x1+ b2x2 + b3x3 +...+ bkxk
Сначала переходят от натурального масштаба к новому, проведя
нормирование
Yi0 =(yi -Ycp)/Sy ; Xij0 = (xij -Xj0 )/Sxj
где i = 1,2,3,...n; j = 1,2,3,..k;
и ищут коэффициенты уравнения
Y0 = a0 + a1x10 + a2x20 + a3x30 +...+ akxk0
Коэффициенты уравнения находят из условия
Ф/a1=1; Ф/a2=1; Ф/ak =1
Составляют систему нормализованных уравнений
a1(x1i0)2 + a2x1i0x2i0 + ...+ akx1i0xki0 =x10yi0
a1 (x2i0x2i0) + a2(x2i0)2 + ...+ak x2i0 xki0 =x2i0 yi0
........
a1xki0x1i0 + a2xki0x2i0 + ...+ak(xki0)2 =xki0yi0
Если умножить на 1/(n-1) и принять во внимание, что
[1/(1-n)] (xij2) = 1
получаем систему нормальных уравнений вида
a1rxkx1+ a2rxkx2 + ... + ak = ryxk
Далее можно рассчитать коэффициент множественной корреляции.
ПРИЛОЖЕНИЯ
х
Таблица 1. Функция Лапласа Ф(х)=[1(2)1/2 ]ехр(-х2/2) dх
o
х |
Ф(х) |
х |
Ф(х) |
х |
Ф(х) |
х |
Ф(х) |
0,00 |
0 |
0,70 |
0,2580 |
1,40 |
0,4192 |
2,10 |
0,4821 |
0,05 |
0,0199 |
0,75 |
0,2734 |
1,45 |
0,4265 |
2,20 |
0,4861 |
0,10 |
0,0398 |
0,80 |
0,2481 |
1,50 |
0,4332 |
2,30 |
0,4893 |
0,15 |
0,0596 |
0,85 |
0,3023 |
1,55 |
0,4394 |
2,40 |
0,4918 |
0,20 |
0,0793 |
0,90 |
0,3159 |
1,60 |
0,4452 |
2,50 |
0,4938 |
0,25 |
0,0987 |
0,95 |
0,3289 |
1,65 |
0,4505 |
2,60 |
0,4953 |
0,30 |
0,1179 |
1,00 |
0,3413 |
1,70 |
0,4554 |
2,70 |
0,4965 |
0,35 |
0,1368 |
1,05 |
0,3531 |
1,75 |
0,4599 |
2,80 |
0,4974 |
0,40 |
0,1554 |
1,10 |
0,3643 |
1,80 |
0,4641 |
2,90 |
0,4981 |
0,45 |
0,1736 |
1,15 |
0,3749 |
1,85 |
0,4678 |
3,00 |
0,49865 |
0,50 |
0,1915 |
1,20 |
0,3849 |
1,90 |
0,4713 |
3,20 |
0,49931 |
0,55 |
0,2088 |
1,25 |
0,3944 |
1,95 |
0,4744 |
3,40 |
0,49966 |
0,60 |
0,2257 |
1,30 |
0,4032 |
2,00 |
0,4783 |
3,60 |
0,49984 |
0,65 |
0,2422 |
1,35 |
0,4115 |
2,06 |
0,4803 |
4,00 |
0,499968 |
Таблица 2. Критерий Стьюдента t: Значения t при данном числе степеней свободы N и данной величине вероятности (уровне значимости) Р.
N |
Р= 0,10 |
P= =0,05 |
P= =0,02 |
Р= 0,01 |
N |
Р= 0,10 |
P= =0,05 |
P= =0,02 |
Р= =0,01 |
1 |
6,31 |
12,704 |
31,821 |
63,7 |
11 |
1,80 |
2,201 |
2,718 |
3,11 |
2 |
2,92 |
4,303 |
6,965 |
9,93 |
12 |
1,78 |
2,179 |
2,681 |
3,06 |
3 |
2,35 |
3,182 |
4,541 |
5,84 |
13 |
1,77 |
2,160 |
2,650 |
3,01 |
4 |
2,13 |
2,778 |
3,747 |
4,60 |
14 |
1,76 |
2,145 |
2,624 |
2,98 |
5 |
2,02 |
2,571 |
3,365 |
4,03 |
15 |
1,75 |
2,131 |
2,602 |
2,95 |
6 |
1,94 |
2,447 |
3,143 |
3,71 |
16 |
1,75 |
2,120 |
2,583 |
2,92 |
7 |
1,90 |
2,365 |
2,998 |
3,50 |
17 |
1,74 |
2,110 |
2,567 |
2,90 |
8 |
1,86 |
2,306 |
2,896 |
3,36 |
20 |
1,73 |
2,086 |
2,528 |
2,85 |
9 |
1,83 |
2,262 |
2,821 |
3,25 |
25 |
1,71 |
2,060 |
2,485 |
2,79 |
10 |
1,81 |
2,288 |
2,764 |
3,17 |
30 |
1,70 |
2,042 |
2,457 |
2,75 |
- 31 -
Таблица 3.Критерий Фишера: значения F=S12/S22 при Р=0,05 N1- число степеней свободы (для числителя); N2- число степней свободы для знаменателя.
N2 |
N1=1 |
N1=3 |
N1=5 |
N1=20 |
1 |
161,4 |
215,70 |
230,2 |
|
2 |
18,51 |
19,16 |
19,30 |
19,4 |
3 |
10,13 |
9,28 |
9,01 |
8,66 |
4 |
7,71 |
6,59 |
6,26 |
5,80 |
5 |
6,61 |
5,41 |
5,05 |
4,56 |
7 |
5,59 |
4,35 |
3,97 |
3,44 |
8 |
5,32 |
4,07 |
3,69 |
3,15 |
9 |
5,12 |
3,86 |
3,48 |
2,94 |
10 |
4,96 |
3,71 |
3,33 |
2,77 |
12 |
|
3,49 |
3,00 |
2,54 |
Таблица 4. Критерий Пирсона (согласия) 2 : значения ,соответствующие значениям Р(2) и числам степеней свободы N.
N |
Р=0,95 |
P=0,05 |
P=0,02 |
N |
Р=0,95 |
P=0,05 |
P=0,02 |
1 |
0,0039 |
3,841 |
5,412 |
9 |
3,32 |
16,919 |
19,679 |
2 |
0,103 |
5,991 |
7,824 |
10 |
3,94 |
18,307 |
21,161 |
3 |
0,352 |
7,815 |
9,837 |
15 |
7,3 |
24,996 |
28,259 |
4 |
0,71 |
9,488 |
11,668 |
20 |
10,9 |
31,410 |
35,020 |
5 |
1,14 |
11,070 |
13,388 |
25 |
14,6 |
37,652 |
41,566 |
7 |
2,17 |
14,067 |
16,622 |
30 |
18,5 |
43,773 |
47,962 |
Литература
1. Ахназарова С.Л., Кафаров В.В. Методы оптимизации эксперимента в химической технологии.М.,Высщая школа, 1985 г.
2. Кафаров В.В. Методы кибернетики в химии и химической технологии.М.,Химия,1976 г.
3.Глудкин О.П. и др. Статистические методы в технологии производства РЭА, М.,Энергия,1977 г.
4. Джонсон Н.,Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы планирования эксперимента.М.,Мир,1981 г.
5.Адлер Ю.П., Маркова Е.В., Грановский Ю.В., Планирование эксперимента при поиске оптимальных условий.М.,Наука,1976 г.