Osnovy_teorii_inzhenernogo_experimenta_Uch_posobie_26_04_02
.pdfbo
b1
|
y x2 |
xy x |
|
16,63 21,20 ( 24,26) ( 14,21) |
0,757 |
, |
||||
|
n x2 |
x 2 |
10 21,20 ( 14,21)2 |
|
||||||
|
|
|
|
|
||||||
n xy x y |
|
10 (24,26) (14,21) 16,63 |
|
0,638 . |
|
|||||
|
|
|
||||||||
|
n x2 x 2 |
|
10 21,20 ( 14,21)2 |
|
|
|
||||
Значит, линейный вид функции следующий:
y = 0,757 – 0,638x. (3.7)
Параметры аппроксимирующей функции ao и a1 следующие: ao 10b0 100,757 5,71
a1 = b1 = – 0,638.
Таким образом, вид аппроксимирующей функции, полученный МНК:
Y = 5,71X–0,638. (3.8)
Как видно, выражение (3.8) практически совпадает с (3.6). То есть не обязательно каждый раз прибегать к помощи МНК, во многих случаях можно ограничиться простыми приѐмами графоаналитического метода.
3.1.3. Определения погрешности предсказания построенным урав-
нением регрессии результатов опытов
После определения параметров аппроксимирующей функции (мо-
дели) оценивают погрешность, с которой полученная модель описывает экспериментальные значения. Погрешность модели можно оценить не-
сколькими способами, например,
определив значимость полученной модели y = b0 + b1x или
определив коэффициент корреляции.
Определение уровня значимости уже приводилось выше в п.1.3.1.
Ниже дадим ещѐ раз определение уровня значимости, сформулирован-
ное другими словами. Уровень значимости — условная величина в про-
центах, характеризующая точность описания экспериментальных дан-
ных полученной моделью. Чем выше уровень значимости, тем менее
61
точна модель, например, модель, описывающая результаты опытов на
5%-м уровне значимости более точная, чем модель, описывающая вы-
борку на 10%-м уровне значимости.
Для проверки значимости полученного уравнения регрессии ис-
пользуют F-критерий Фишера, который, как об этом уже подробно гово-
рилось в п. 2.2.1, представляет собой отношение дисперсий двух сравни-
ваемых выборок. В нашем случае с помощью F-критерия Фишера необ-
ходимо определить, во сколько раз уравнение регрессии предсказывает
результаты опытов лучше, чем среднее значение y . Поэтому экспери-
ментальное значение критерия Фишера запишем в следующем виде:
F |
|
S y2 |
, |
(3.9) |
|
||||
экс |
|
Sост2 |
|
|
|
|
|
|
|
где S y2 — дисперсия значений yi |
|
|
|
|
относительно среднего значения y (см. |
||||
рис. 3.2), характеризующая разброс значений yi относительно среднего
|
Sост2 — остаточная дисперсия, характеризующая разброс |
||||||||
значения y ; |
|||||||||
значений yi |
относительно линии регрессии y = b0 + b1x, причем: |
|
|||||||
|
|
|
|
|
|
2 |
|
|
|
|
|
yi |
|
|
|
|
|
||
|
|
y |
|
|
|
|
|||
|
Sy2 |
|
|
|
|
|
, |
|
(3.10) |
|
|
n 1 |
|
|
|||||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
2 |
|
|||
|
|
|
yi yi |
|
|||||
|
S 2 |
|
|
|
|
|
|
, |
(3.11) |
|
|
|
|
|
|
||||
|
ост |
|
|
n l |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где l – количество параметров (коэффициентов) в уравнении регрессии
(в нашем случае l = 2).
Необходимо ещѐ раз во избежание путаницы обратить внимание
на обозначения yi, y и yi , применяемые в формулах (3.10) и (3.11):
yi — значение ординаты i-й экспериментальной точки, т. е. эксперимен-
тальной точки с координатами (xi, yi);
62
yi — значения y, рассчитанные по модели y = b0 + b1x при подстановке в
неѐ значения xi, т. е. yi = y(xi);
y — среднее арифметическое значение всех ординат yi эксперименталь-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ных точек, т. е. |
y yi / n. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Знаменатели в формулах (3.10) и (3.11) представляют собой числа |
|||||||||||||||||||
степеней свободы (см. 1.3.2) v1 |
и v2 соответственно, т. е. |
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
v1 = n – 1 и v2 = n – l. |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
Расчѐты сумм, стоящих в выражениях (3.10) и (3.11) удобно вести |
|||||||||||||||||||
в табличной форме (табл. 3.5) в программе Excel. |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 3.5 |
||||
|
Табличная форма для вычисления общей и остаточной дисперсий |
|
||||||||||||||||||
№ |
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
yi |
|
|
2 |
опыта |
xi |
|
yi |
y b b x |
|
y y |
|
yi |
yi |
|
|
yi y |
|
y |
|
|||||
|
|
|
i 0 1 i |
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
. |
. |
|
. |
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
. |
. |
|
. |
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
. |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
. |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Σ |
– |
|
|
|
|
– |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Следует несколько слов сказать об остаточной дисперсии Sост2 , так как она имеет большое значение в теории построения эмпирических за-
висимостей. В литературе можно встретить другие названия Sост2 : сумма квадратов остатков; остаточная сумма квадратов. Смысл остаточной дисперсии Sост2 понимается лучше, если сравнить эксперименты, состо-
ящие в многократном измерении одного и того же значения физической величины (см. разд. 2), с экспериментами по определению зависимости какой-либо физической величины от разных факторов. В эксперимен-
тах по многократному измерению одного и того же значения измеряе-
мой величины центром распределения полученных отсчѐтов является
63
среднее арифметическое полученных значений. Если же эксперимент состоит в определении физической величины как функции одной или не-
скольких переменных, то усреднѐнный результат — искомая функция, а
погрешность предсказания уравнением регрессии результатов опытов характеризуется остаточной дисперсией Sост2 .
Полученное значение Fэкс сравнивают с табличным значением Fтабл
(табл. 2.5 или 2.6), найденным для требуемого уровня значимости и значений числа степеней свободы v1 = n – 1 и v2 = n – l. Если Fэкс > Fтабл, то полагают, что уравнение регрессии адекватно описывает опытные
данные.
Пример. Оценим значимость полученного уравнения регрессии
(3.7):
y = 0,757 – 0,638x.
Решение. Сначала по формуле (3.10) рассчитаем дисперсию S y2 , харак-
|
|
|
теризующую разброс значений yi относительно среднего значения |
y |
|
|
|
|
(рис. 3.4), причѐм y yi |
/ n. А затем по формуле (3.11) рассчитаем |
|
остаточную дисперсию Sост2 |
, характеризующую разброс значений yi |
от- |
носительно линии регрессии y = 0,757 – 0,638x (рис. 3.4). Промежуточ-
ные расчѐты выполним в табличной форме (табл. 3.6). Тогда:
S y2
Sост2
|
|
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yi |
|
|
|
16,62 |
|
|
|
|
||||
|
|
y |
|
i 1 |
|
1,662. |
|
|||||||||
|
|
|
|
|
|
|
||||||||||
|
|
|
|
10 |
|
|
|
|
|
10 |
|
|
|
|
||
n |
|
|
|
2 |
|
10 |
yi 1,662 2 |
|
||||||||
|
yi |
y |
|
|
|
|
||||||||||
i 1 |
|
|
|
|
|
i 1 |
|
|
0,457 |
, |
||||||
|
|
n 1 |
|
|
|
|
10 1 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
n |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
yi yi |
|
|
|
|
0,008280 |
|
|
|
|||||
|
i 1 |
|
|
|
|
|
|
|
0,00104 |
|
||||||
|
|
|
n l |
|
|
|
|
10 2 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
64 |
|
|
|
|
||||
Таблица 3.6 Табличная форма для вычисления общей и остаточной дисперсий
№ |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yi y |
yi y |
2 |
|||||
|
|
|
|
|
|||||||||||
опы- |
xi |
yi |
y |
yi yi |
yi |
yi |
|
|
|||||||
та |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
-2,00 |
2,00 |
2,03 |
-0,0309 |
0,00095481 |
0,3377 |
0,1140 |
||||||||
2 |
-1,824 |
1,954 |
1,92 |
0,0352 |
0,00123734 |
0,2917 |
0,0851 |
||||||||
3 |
-1,699 |
1,875 |
1,84 |
0,0358 |
0,00127987 |
0,2127 |
0,0452 |
||||||||
4 |
-1,523 |
1,681 |
1,73 |
-0,0461 |
0,00212972 |
0,0187 |
0,0003 |
||||||||
5 |
-1,398 |
1,643 |
1,65 |
-0,0045 |
2,0698E-05 |
-0,0193 |
0,0004 |
||||||||
6 |
-1,301 |
1,580 |
1,59 |
-0,0058 |
3,3413E-05 |
-0,0823 |
0,0068 |
||||||||
7 |
-1,222 |
1,568 |
1,54 |
0,0325 |
0,00105796 |
-0,0943 |
0,0089 |
||||||||
8 |
-1,155 |
1,462 |
1,49 |
-0,0308 |
0,00094916 |
-0,2003 |
0,0401 |
||||||||
9 |
-1,071 |
1,462 |
1,44 |
0,0227 |
0,00051449 |
-0,2003 |
0,0401 |
||||||||
10 |
-1,022 |
1,398 |
1,41 |
-0,0101 |
0,00010231 |
-0,2643 |
0,0699 |
||||||||
Σ |
-14,21 |
16,62 |
— |
— |
0,008280 |
— |
0,4109 |
||||||||
Тогда экспериментальное значение критерия Фишера примет сле-
дующее значение:
F |
Sy2 |
|
0,457 |
439 . |
|
|
|||
экс |
S 2 |
|
0,00104 |
|
|
|
|
||
|
ост |
|
|
|
По табл. 2.5 для уровня значимости q = 5 % и числа степеней свободы v1 = n – 1 = 10 –1 = 9 и v2 = n – l = 10 – 2 = 8 найдѐм, что табличное значения критерия Фишера Fтабл = 3,39.
Так как Fэкс >> Fтабл, то полученное уравнение регрессии значимо описывает результаты эксперимента на уровне существенно меньше
5%, т. е. очень точно.
3.2.Основы корреляционного анализа. Коэффициент кор-
реляции
В отличие от математики, где чаще всего имеют дело с функцио-
нальными зависимостями, в соответствии с которыми между значения-
ми величин, находящихся в функциональной связи, имеет место одно-
значное соответствие, в технике при изучении различных явлений при-
65
ходится в большинстве случаев иметь дело со стохастическими (корре-
ляционными) зависимостями, когда каждому значению одной физиче-
ской величины (фактора) может соответствовать множество значений другой величины (отклика). При этом часто возникают ситуации, когда необходимо оценить, насколько сильна связь между физическими вели-
чинами. Распространѐнной мерой степени связи (зависимости одной от другой) между физическими величинами является коэффициент корре-
ляции.
Коэффициент корреляции характеризует степень тесноты группи-
рования экспериментальных точек вокруг прямой линии. Значение ко-
эффициента корреляции ρ лежит в следующем диапазоне5: –1 ≤ ρ ≤ 1
(рис. 3.4).
а |
б |
в |
y |
y |
y |
0 |
x |
0 |
x |
0 |
x |
Рис. 3.4. Связь между случайными величинами x и y характеризуется коэффициентом корреляции: близким к нулю (а); бóльшим 0,7 (б); близким к –1 (в)
Когда коэффициент корреляции по абсолютной величине равен 1,
все точки располагаются точно на прямой линии, если абсолютная вели-
чина коэффициента корреляции больше 0,7, то считают, что между пе-
ременными y и x сильная корреляции, если коэффициент корреляции меньше 0,2, то – корреляция практически отсутствует (рис. 3.4).
Особенность МНК в том, что, он оперирует не с (кратчайшими)
расстояниями экспериментальных точек до линии регрессии, а с их от-
5 ρ > 0, когда с увеличением x значение y имеет тенденцию к увеличению; ρ < 0, когда с увеличением x значение y имеет тенденцию к уменьшению
66
клонениями вдоль оси y или x. Расстояния, как известно, определяются по перпендикулярам, опущенным из точек на предполагаемую линию регрессии, а отклонения вдоль осей координат — отрезками, проведѐн-
ными из точек до линии регрессии параллельно оси y или x соответ-
ственно. Поэтому, если по имеющейся выборке значения построить ре-
грессию y по x, выражаемую уравнением y = b0 + b1x, а затем – x по y,
выражаемую уравнением x = a0 + a1y, то эти две прямые не совпадут, а
образуют «ножницы»6 (рис. 3.5), причѐм всегда регрессия x по y идѐт круче регрессии y по x. Если уравнение x = a0 + a1y представить в более
удобной для сравнения форме y b' |
b' x , то всегда b' |
b . |
||||
|
|
|
o |
1 |
1 |
1 |
y |
|
Регрессия x по y |
|
|
||
|
y =b0 |
+ b1x |
|
|
||
|
|
|
|
|||
|
Регрессия y по x |
|
|
|
b1 |
|
|
y = b + b x |
|
|
b1 |
||
y |
0 |
1 |
|
|
|
|
|
|
|
|
|
|
|
0 |
|
x |
x |
Рис. 3.5. К определению коэффициента корреляции (пояснение в тексте) |
|||
Коэффициент корреляции ρ определяется через отношение угло- |
|||
вых коэффициентов b |
1 |
и b' по формуле (3.9): |
|
|
1 |
|
|
6 При малом коэффициенте корреляции эти «ножницы» становятся очень большими, и считается, что МНК становится неэффективным. В этом случае целесообразно переходить от МНК к методу ортогональной регрессии.
67
ρ |
|
b1 |
|
|
|
b' |
|||||
|
|
|
|
||
|
|
1 |
|
|
|
|
|
x y |
1 |
x |
y |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
i i |
n |
i |
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
(3.12) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
x2 |
|
1 |
x |
2 y2 |
|
1 |
y |
2 |
|
|||||
|
|
|
|
||||||||||||
|
|
i |
|
n |
i |
|
|
i |
|
n |
i |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||||
Пример. Оценим коэффициент корреляции данных эксперимента,
представленных в табл. 3.4.
Решение. Вычислим суммы, представленные в выражении (3.12) в
табличной форме (табл. 3.7).
Таблица 3.7 Результаты расчѐта сумм, представленных в выражении (3.12)
№ опыта |
|
|
|
xi |
|
|
|
yi |
|
|
|
|
xi yi |
|
|
|
|
|
|
x2 |
|
|
y2 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
i |
1 |
|
|
|
|
-2,00 |
|
|
2,00 |
|
|
|
-4 |
|
|
|
|
4 |
|
|
4 |
||||||||||
2 |
|
|
|
|
-1,824 |
|
|
1,954 |
|
|
-3,5641 |
|
|
|
|
3,32698 |
|
3,8181 |
||||||||||||
3 |
|
|
|
|
-1,699 |
|
|
1,875 |
|
|
-3,1856 |
|
|
|
|
2,8866 |
|
3,5156 |
||||||||||||
4 |
|
|
|
|
-1,523 |
|
|
1,681 |
|
|
-2,5602 |
|
|
|
|
2,31953 |
|
2,8258 |
||||||||||||
5 |
|
|
|
|
-1,398 |
|
|
1,643 |
|
|
-2,2969 |
|
|
|
|
1,9544 |
|
2,6994 |
||||||||||||
6 |
|
|
|
|
-1,301 |
|
|
1,580 |
|
|
-2,0556 |
|
|
|
|
1,6926 |
|
2,4964 |
||||||||||||
7 |
|
|
|
|
-1,222 |
|
|
1,568 |
|
|
-1,9161 |
|
|
|
|
1,49328 |
|
2,4586 |
||||||||||||
8 |
|
|
|
|
-1,155 |
|
|
1,462 |
|
|
-1,6886 |
|
|
|
|
1,33403 |
|
2,1374 |
||||||||||||
9 |
|
|
|
|
-1,071 |
|
|
1,462 |
|
|
-1,5658 |
|
|
|
|
1,14704 |
|
2,1374 |
||||||||||||
10 |
|
|
|
|
-1,022 |
|
|
1,398 |
|
|
-1,4288 |
|
|
|
|
1,04448 |
|
1,9544 |
||||||||||||
|
|
Σ |
|
|
|
|
-14,21 |
|
|
16,62 |
|
|
-24,26 |
|
|
|
|
21,20 |
|
28,04 |
||||||||||
|
|
|
|
xi yi |
1 |
xi yi |
|
|
|
|
24,26 |
|
1 |
( 14,21) 16,62 |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
10 |
|
|
|
|||||||||||||||||||
ρ |
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,99. |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
x2 |
|
1 |
x |
2 y2 |
|
1 |
y |
2 |
21,20 |
|
1 |
( 14,21)2 |
28,04 |
1 |
16,622 |
|||||||||||||
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
i |
|
n |
i |
|
|
i |
|
n |
i |
|
|
10 |
|
|
|
|
|
10 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
Значения коэффициента корреляции получились очень высокими, рав-
ными –0,99. Знак минус указывает на то, что зависимость убывающая.
На рис. 3.6 представлены регрессия y по x и регрессия x по y. Об-
ратную регрессию построили, определив по выражению (3.12) угловой коэффициент обратной регрессии. Согласно уравнению (3.7) прямой ре-
грессии угловой коэффициент b1 = –0,638, тогда угловой коэффициент обратной регрессии
b1' b1 0,638 0,651.
ρ2 0,992
68
у 2,0 |
|
|
|
|
|
1,9 |
|
|
- линия регрессии у по x |
||
|
|
|
|||
|
|
|
- линия регрессии x по у |
||
1,8 |
|
|
|
|
|
1,7 |
|
|
|
|
|
1,6 |
|
|
|
|
|
1,5 |
|
|
|
|
|
1,4 |
|
|
|
|
|
1,3 |
|
|
|
|
|
-2,0 |
-1,8 |
-1,6 |
-1,4 |
-1,2 |
-1,0 |
|
|
|
|
|
x |
Рис. 3.6. Линии прямой и обратной регрессии, построенные для экспериментальных |
|||||
|
|
данных табл. 3.4 |
|
|
|
Коэффициент b0' регрессии x по y определим с учѐтом того, что линии регрессии проходят через центр тяжести поля экспериментальных точек.
Центр тяжести имеет координаты x, y , где x — среднее арифметиче-
ское значение абсцисс экспериментальных точек, а y — среднее ариф-
метическое значение ординат экспериментальных точек.
10 |
|
|
|
|
|
|
|
|||||
|
|
|
x |
|
|
14,21 |
|
|||||
|
|
i 1 i |
|
|
1,42, |
|||||||
x |
||||||||||||
|
|
|
|
|
||||||||
10 |
|
|
|
|
10 |
|
||||||
10 |
|
|
|
|
|
|
|
|||||
|
|
|
|
y |
|
|
|
|
||||
|
|
i 1 |
i |
|
16,62 |
1,66. |
||||||
|
y |
|
||||||||||
|
|
|
|
|
|
|||||||
10 |
|
|
|
10 |
|
|||||||
Тогда, подставив значения x = –1,42 и y = 1,66 в уравнение регрессии x
по y: y bo' b1' x , то получим:
1,66 bo' 0,651 ( 1,42),
69
Отсюда bo' 1,66 0,651 1,42 0,736. А значит уравнение регрессии x по y запишется в виде:
y = 0,736 – 0,651x.
Как видно из рис. 3.6, две регрессии образуют не очень большие
«ножницы», что объясняется очень высоким коэффициентом корреля-
ции экспериментальных данных.
Важно отметить, что изложенную методику проверки адекватно-
сти модели на основе F-критерия Фишера, можно с таким же успехом использовать и применительно к моделям, полученным графоаналити-
ческим методом (в нашем случае это модель (3.6)), только предвари-
тельно их надо преобразовать к линейному виду.
3.3. Активный эксперимент
Недостаток пассивного эксперимента – резкое возрастание коли-
чества опытов с ростом числа факторов, поэтому, когда требуется оце-
нить влияние двух и более факторов на интересующую исследователя физическую величину, прибегают к помощи активного эксперимента.
Вопросами эффективной постановки активного эксперимента за-
нимается теория планирования эксперимента.
При проведении аналитической части активного эксперимента решаются следующие задачи:
1.Установления вида аппроксимирующей функции,
2.Составления плана эксперимента,
апосле проведения собственно экспериментальной части ещѐ и
3.Расчѐта параметров аппроксимирующей функции,
4.Определения погрешности предсказания построенным уравне-
нием аппроксимирующей функции (уравнением регрессии) ре-
зультатов опытов.
70
