Добавил:
Скидываю свои работы с фака 26.04.02 Кораблястроение, 23.05.01 Подъёмно-транспортные механизмы, 44.02.03 Педагогика дополнительного образования Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Osnovy_teorii_inzhenernogo_experimenta_Uch_posobie_26_04_02

.pdf
Скачиваний:
8
Добавлен:
07.10.2024
Размер:
1.54 Mб
Скачать

bo

b1

 

y x2

xy x

 

16,63 21,20 ( 24,26) ( 14,21)

0,757

,

 

n x2

x 2

10 21,20 ( 14,21)2

 

 

 

 

 

 

n xy x y

 

10 (24,26) (14,21) 16,63

 

0,638 .

 

 

 

 

 

n x2 x 2

 

10 21,20 ( 14,21)2

 

 

 

Значит, линейный вид функции следующий:

y = 0,757 – 0,638x. (3.7)

Параметры аппроксимирующей функции ao и a1 следующие: ao 10b0 100,757 5,71

a1 = b1 = – 0,638.

Таким образом, вид аппроксимирующей функции, полученный МНК:

Y = 5,71X–0,638. (3.8)

Как видно, выражение (3.8) практически совпадает с (3.6). То есть не обязательно каждый раз прибегать к помощи МНК, во многих случаях можно ограничиться простыми приѐмами графоаналитического метода.

3.1.3. Определения погрешности предсказания построенным урав-

нением регрессии результатов опытов

После определения параметров аппроксимирующей функции (мо-

дели) оценивают погрешность, с которой полученная модель описывает экспериментальные значения. Погрешность модели можно оценить не-

сколькими способами, например,

определив значимость полученной модели y = b0 + b1x или

определив коэффициент корреляции.

Определение уровня значимости уже приводилось выше в п.1.3.1.

Ниже дадим ещѐ раз определение уровня значимости, сформулирован-

ное другими словами. Уровень значимости — условная величина в про-

центах, характеризующая точность описания экспериментальных дан-

ных полученной моделью. Чем выше уровень значимости, тем менее

61

точна модель, например, модель, описывающая результаты опытов на

5%-м уровне значимости более точная, чем модель, описывающая вы-

борку на 10%-м уровне значимости.

Для проверки значимости полученного уравнения регрессии ис-

пользуют F-критерий Фишера, который, как об этом уже подробно гово-

рилось в п. 2.2.1, представляет собой отношение дисперсий двух сравни-

ваемых выборок. В нашем случае с помощью F-критерия Фишера необ-

ходимо определить, во сколько раз уравнение регрессии предсказывает

результаты опытов лучше, чем среднее значение y . Поэтому экспери-

ментальное значение критерия Фишера запишем в следующем виде:

F

 

S y2

,

(3.9)

 

экс

 

Sост2

 

 

 

 

 

 

где S y2 — дисперсия значений yi

 

 

 

 

относительно среднего значения y (см.

рис. 3.2), характеризующая разброс значений yi относительно среднего

 

Sост2 остаточная дисперсия, характеризующая разброс

значения y ;

значений yi

относительно линии регрессии y = b0 + b1x, причем:

 

 

 

 

 

 

 

2

 

 

 

 

 

yi

 

 

 

 

 

 

 

y

 

 

 

 

 

Sy2

 

 

 

 

 

,

 

(3.10)

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

yi yi

 

 

S 2

 

 

 

 

 

 

,

(3.11)

 

 

 

 

 

 

 

ост

 

 

n l

 

 

 

 

 

 

 

 

 

 

 

 

где l – количество параметров (коэффициентов) в уравнении регрессии

(в нашем случае l = 2).

Необходимо ещѐ раз во избежание путаницы обратить внимание

на обозначения yi, y и yi , применяемые в формулах (3.10) и (3.11):

yi — значение ординаты i-й экспериментальной точки, т. е. эксперимен-

тальной точки с координатами (xi, yi);

62

yi — значения y, рассчитанные по модели y = b0 + b1x при подстановке в

неѐ значения xi, т. е. yi = y(xi);

y — среднее арифметическое значение всех ординат yi эксперименталь-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ных точек, т. е.

y yi / n.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Знаменатели в формулах (3.10) и (3.11) представляют собой числа

степеней свободы (см. 1.3.2) v1

и v2 соответственно, т. е.

 

 

 

 

 

 

 

 

 

 

 

 

v1 = n – 1 и v2 = n l.

 

 

 

 

 

 

 

 

 

 

 

 

Расчѐты сумм, стоящих в выражениях (3.10) и (3.11) удобно вести

в табличной форме (табл. 3.5) в программе Excel.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3.5

 

Табличная форма для вычисления общей и остаточной дисперсий

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

yi

 

 

2

опыта

xi

 

yi

y b b x

 

y y

 

yi

yi

 

 

yi y

 

y

 

 

 

 

i 0 1 i

 

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

.

.

 

.

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

.

.

 

.

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

.

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

.

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следует несколько слов сказать об остаточной дисперсии Sост2 , так как она имеет большое значение в теории построения эмпирических за-

висимостей. В литературе можно встретить другие названия Sост2 : сумма квадратов остатков; остаточная сумма квадратов. Смысл остаточной дисперсии Sост2 понимается лучше, если сравнить эксперименты, состо-

ящие в многократном измерении одного и того же значения физической величины (см. разд. 2), с экспериментами по определению зависимости какой-либо физической величины от разных факторов. В эксперимен-

тах по многократному измерению одного и того же значения измеряе-

мой величины центром распределения полученных отсчѐтов является

63

среднее арифметическое полученных значений. Если же эксперимент состоит в определении физической величины как функции одной или не-

скольких переменных, то усреднѐнный результат — искомая функция, а

погрешность предсказания уравнением регрессии результатов опытов характеризуется остаточной дисперсией Sост2 .

Полученное значение Fэкс сравнивают с табличным значением Fтабл

(табл. 2.5 или 2.6), найденным для требуемого уровня значимости и значений числа степеней свободы v1 = n – 1 и v2 = n l. Если Fэкс > Fтабл, то полагают, что уравнение регрессии адекватно описывает опытные

данные.

Пример. Оценим значимость полученного уравнения регрессии

(3.7):

y = 0,757 – 0,638x.

Решение. Сначала по формуле (3.10) рассчитаем дисперсию S y2 , харак-

 

 

 

теризующую разброс значений yi относительно среднего значения

y

 

 

 

(рис. 3.4), причѐм y yi

/ n. А затем по формуле (3.11) рассчитаем

остаточную дисперсию Sост2

, характеризующую разброс значений yi

от-

носительно линии регрессии y = 0,757 – 0,638x (рис. 3.4). Промежуточ-

ные расчѐты выполним в табличной форме (табл. 3.6). Тогда:

S y2

Sост2

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

 

 

 

16,62

 

 

 

 

 

 

y

 

i 1

 

1,662.

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

10

 

 

 

 

n

 

 

 

2

 

10

yi 1,662 2

 

 

yi

y

 

 

 

 

i 1

 

 

 

 

 

i 1

 

 

0,457

,

 

 

n 1

 

 

 

 

10 1

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

yi yi

 

 

 

 

0,008280

 

 

 

 

i 1

 

 

 

 

 

 

 

0,00104

 

 

 

 

n l

 

 

 

 

10 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

64

 

 

 

 

Таблица 3.6 Табличная форма для вычисления общей и остаточной дисперсий

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi y

yi y

2

 

 

 

 

 

опы-

xi

yi

y

yi yi

yi

yi

 

 

та

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

-2,00

2,00

2,03

-0,0309

0,00095481

0,3377

0,1140

2

-1,824

1,954

1,92

0,0352

0,00123734

0,2917

0,0851

3

-1,699

1,875

1,84

0,0358

0,00127987

0,2127

0,0452

4

-1,523

1,681

1,73

-0,0461

0,00212972

0,0187

0,0003

5

-1,398

1,643

1,65

-0,0045

2,0698E-05

-0,0193

0,0004

6

-1,301

1,580

1,59

-0,0058

3,3413E-05

-0,0823

0,0068

7

-1,222

1,568

1,54

0,0325

0,00105796

-0,0943

0,0089

8

-1,155

1,462

1,49

-0,0308

0,00094916

-0,2003

0,0401

9

-1,071

1,462

1,44

0,0227

0,00051449

-0,2003

0,0401

10

-1,022

1,398

1,41

-0,0101

0,00010231

-0,2643

0,0699

Σ

-14,21

16,62

0,008280

0,4109

Тогда экспериментальное значение критерия Фишера примет сле-

дующее значение:

F

Sy2

 

0,457

439 .

 

 

экс

S 2

 

0,00104

 

 

 

 

 

ост

 

 

 

По табл. 2.5 для уровня значимости q = 5 % и числа степеней свободы v1 = n – 1 = 10 –1 = 9 и v2 = n l = 10 – 2 = 8 найдѐм, что табличное значения критерия Фишера Fтабл = 3,39.

Так как Fэкс >> Fтабл, то полученное уравнение регрессии значимо описывает результаты эксперимента на уровне существенно меньше

5%, т. е. очень точно.

3.2.Основы корреляционного анализа. Коэффициент кор-

реляции

В отличие от математики, где чаще всего имеют дело с функцио-

нальными зависимостями, в соответствии с которыми между значения-

ми величин, находящихся в функциональной связи, имеет место одно-

значное соответствие, в технике при изучении различных явлений при-

65

ходится в большинстве случаев иметь дело со стохастическими (корре-

ляционными) зависимостями, когда каждому значению одной физиче-

ской величины (фактора) может соответствовать множество значений другой величины (отклика). При этом часто возникают ситуации, когда необходимо оценить, насколько сильна связь между физическими вели-

чинами. Распространѐнной мерой степени связи (зависимости одной от другой) между физическими величинами является коэффициент корре-

ляции.

Коэффициент корреляции характеризует степень тесноты группи-

рования экспериментальных точек вокруг прямой линии. Значение ко-

эффициента корреляции ρ лежит в следующем диапазоне5: –1 ≤ ρ ≤ 1

(рис. 3.4).

а

б

в

y

y

y

0

x

0

x

0

x

Рис. 3.4. Связь между случайными величинами x и y характеризуется коэффициентом корреляции: близким к нулю (а); бóльшим 0,7 (б); близким к –1 (в)

Когда коэффициент корреляции по абсолютной величине равен 1,

все точки располагаются точно на прямой линии, если абсолютная вели-

чина коэффициента корреляции больше 0,7, то считают, что между пе-

ременными y и x сильная корреляции, если коэффициент корреляции меньше 0,2, то – корреляция практически отсутствует (рис. 3.4).

Особенность МНК в том, что, он оперирует не с (кратчайшими)

расстояниями экспериментальных точек до линии регрессии, а с их от-

5 ρ > 0, когда с увеличением x значение y имеет тенденцию к увеличению; ρ < 0, когда с увеличением x значение y имеет тенденцию к уменьшению

66

клонениями вдоль оси y или x. Расстояния, как известно, определяются по перпендикулярам, опущенным из точек на предполагаемую линию регрессии, а отклонения вдоль осей координат — отрезками, проведѐн-

ными из точек до линии регрессии параллельно оси y или x соответ-

ственно. Поэтому, если по имеющейся выборке значения построить ре-

грессию y по x, выражаемую уравнением y = b0 + b1x, а затем – x по y,

выражаемую уравнением x = a0 + a1y, то эти две прямые не совпадут, а

образуют «ножницы»6 (рис. 3.5), причѐм всегда регрессия x по y идѐт круче регрессии y по x. Если уравнение x = a0 + a1y представить в более

удобной для сравнения форме y b'

b' x , то всегда b'

b .

 

 

 

o

1

1

1

y

 

Регрессия x по y

 

 

 

y =b0

+ b1x

 

 

 

 

 

 

 

Регрессия y по x

 

 

 

b1

 

y = b + b x

 

 

b1

y

0

1

 

 

 

 

 

 

 

 

 

 

0

 

x

x

Рис. 3.5. К определению коэффициента корреляции (пояснение в тексте)

Коэффициент корреляции ρ определяется через отношение угло-

вых коэффициентов b

1

и b' по формуле (3.9):

 

 

1

 

6 При малом коэффициенте корреляции эти «ножницы» становятся очень большими, и считается, что МНК становится неэффективным. В этом случае целесообразно переходить от МНК к методу ортогональной регрессии.

67

ρ

 

b1

 

 

b'

 

 

 

 

 

 

1

 

 

 

 

 

x y

1

x

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i i

n

i

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

(3.12)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

1

x

2 y2

 

1

y

2

 

 

 

 

 

 

 

i

 

n

i

 

 

i

 

n

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Оценим коэффициент корреляции данных эксперимента,

представленных в табл. 3.4.

Решение. Вычислим суммы, представленные в выражении (3.12) в

табличной форме (табл. 3.7).

Таблица 3.7 Результаты расчѐта сумм, представленных в выражении (3.12)

№ опыта

 

 

 

xi

 

 

 

yi

 

 

 

 

xi yi

 

 

 

 

 

 

x2

 

 

y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

i

1

 

 

 

 

-2,00

 

 

2,00

 

 

 

-4

 

 

 

 

4

 

 

4

2

 

 

 

 

-1,824

 

 

1,954

 

 

-3,5641

 

 

 

 

3,32698

 

3,8181

3

 

 

 

 

-1,699

 

 

1,875

 

 

-3,1856

 

 

 

 

2,8866

 

3,5156

4

 

 

 

 

-1,523

 

 

1,681

 

 

-2,5602

 

 

 

 

2,31953

 

2,8258

5

 

 

 

 

-1,398

 

 

1,643

 

 

-2,2969

 

 

 

 

1,9544

 

2,6994

6

 

 

 

 

-1,301

 

 

1,580

 

 

-2,0556

 

 

 

 

1,6926

 

2,4964

7

 

 

 

 

-1,222

 

 

1,568

 

 

-1,9161

 

 

 

 

1,49328

 

2,4586

8

 

 

 

 

-1,155

 

 

1,462

 

 

-1,6886

 

 

 

 

1,33403

 

2,1374

9

 

 

 

 

-1,071

 

 

1,462

 

 

-1,5658

 

 

 

 

1,14704

 

2,1374

10

 

 

 

 

-1,022

 

 

1,398

 

 

-1,4288

 

 

 

 

1,04448

 

1,9544

 

 

Σ

 

 

 

 

-14,21

 

 

16,62

 

 

-24,26

 

 

 

 

21,20

 

28,04

 

 

 

 

xi yi

1

xi yi

 

 

 

 

24,26

 

1

( 14,21) 16,62

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

ρ

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,99.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

1

x

2 y2

 

1

y

2

21,20

 

1

( 14,21)2

28,04

1

16,622

 

 

 

 

 

 

 

i

 

n

i

 

 

i

 

n

i

 

 

10

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значения коэффициента корреляции получились очень высокими, рав-

ными –0,99. Знак минус указывает на то, что зависимость убывающая.

На рис. 3.6 представлены регрессия y по x и регрессия x по y. Об-

ратную регрессию построили, определив по выражению (3.12) угловой коэффициент обратной регрессии. Согласно уравнению (3.7) прямой ре-

грессии угловой коэффициент b1 = –0,638, тогда угловой коэффициент обратной регрессии

b1' b1 0,638 0,651.

ρ2 0,992

68

у 2,0

 

 

 

 

 

1,9

 

 

- линия регрессии у по x

 

 

 

 

 

 

- линия регрессии x по у

1,8

 

 

 

 

 

1,7

 

 

 

 

 

1,6

 

 

 

 

 

1,5

 

 

 

 

 

1,4

 

 

 

 

 

1,3

 

 

 

 

 

-2,0

-1,8

-1,6

-1,4

-1,2

-1,0

 

 

 

 

 

x

Рис. 3.6. Линии прямой и обратной регрессии, построенные для экспериментальных

 

 

данных табл. 3.4

 

 

Коэффициент b0' регрессии x по y определим с учѐтом того, что линии регрессии проходят через центр тяжести поля экспериментальных точек.

Центр тяжести имеет координаты x, y , где x — среднее арифметиче-

ское значение абсцисс экспериментальных точек, а y — среднее ариф-

метическое значение ординат экспериментальных точек.

10

 

 

 

 

 

 

 

 

 

 

x

 

 

14,21

 

 

 

i 1 i

 

 

1,42,

x

 

 

 

 

 

10

 

 

 

 

10

 

10

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

i 1

i

 

16,62

1,66.

 

y

 

 

 

 

 

 

 

10

 

 

 

10

 

Тогда, подставив значения x = –1,42 и y = 1,66 в уравнение регрессии x

по y: y bo' b1' x , то получим:

1,66 bo' 0,651 ( 1,42),

69

Отсюда bo' 1,66 0,651 1,42 0,736. А значит уравнение регрессии x по y запишется в виде:

y = 0,736 – 0,651x.

Как видно из рис. 3.6, две регрессии образуют не очень большие

«ножницы», что объясняется очень высоким коэффициентом корреля-

ции экспериментальных данных.

Важно отметить, что изложенную методику проверки адекватно-

сти модели на основе F-критерия Фишера, можно с таким же успехом использовать и применительно к моделям, полученным графоаналити-

ческим методом (в нашем случае это модель (3.6)), только предвари-

тельно их надо преобразовать к линейному виду.

3.3. Активный эксперимент

Недостаток пассивного эксперимента – резкое возрастание коли-

чества опытов с ростом числа факторов, поэтому, когда требуется оце-

нить влияние двух и более факторов на интересующую исследователя физическую величину, прибегают к помощи активного эксперимента.

Вопросами эффективной постановки активного эксперимента за-

нимается теория планирования эксперимента.

При проведении аналитической части активного эксперимента решаются следующие задачи:

1.Установления вида аппроксимирующей функции,

2.Составления плана эксперимента,

апосле проведения собственно экспериментальной части ещѐ и

3.Расчѐта параметров аппроксимирующей функции,

4.Определения погрешности предсказания построенным уравне-

нием аппроксимирующей функции (уравнением регрессии) ре-

зультатов опытов.

70