Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции 2017 ОНИ.doc
Скачиваний:
6
Добавлен:
01.07.2025
Размер:
3.16 Mб
Скачать

5. Обработка результатов эксперимента:

- определение коэффициентов уравнения регрессии;

- проверка значимости коэффициентов;

- проверка адекватности модели;

- интерпретация результатов.

4.8.1 Требования к эксперименту по оценке прецизионности.

Программа исследований по ГОСТ Р ИСО 5725-2-2002 Точность (правильность и Прецизионность) методов и результатов измерений. Часть 2 Основной метод определения повторяемости и воспроизводимости стандартного метода измерений

1. Выполнение измерений должно быть организовано с соблюдением следующих требований.

a) Любая предварительная проверка оборудования должна соответствовать требованиям стандарта на метод измерений.

b) Каждая группа из n измерений, относящихся к одному уровню, должна осуществляться при соблюдении условий повторяемости, т.е. в пределах короткого интервала времени и одним и тем же оператором, а также без какой бы то ни было промежуточной перекалибровки аппаратуры, если только это не является неотъемлемой частью выполнения измерений.

c) Необходимо, чтобы группа из n измерений в условиях повторяемости выполнялась независимым образом так, как если бы это были n измерений на различных материалах. Тем не менее, как правило, оператор знает, что он исследует идентичный материал, и поэтому в инструкциях необходимо подчеркнуть, что главной целью эксперимента является определение именно различий (расхождений) в результатах, которые могут появиться при реальных испытаниях. Если же есть основания опасаться, что, несмотря на данное предостережение, предварительные результаты могут повлиять на последующие результаты измерений и, следовательно, на дисперсию повторяемости, то следует принять решение, включать ли в число п на каждом из q уровней некоторое количество проб (образцов) из других уровней, так чтобы оператор не знал, какие из них являются повторами для данного уровня (модифицировав таким перемешиванием основной метод). Такая методика, однако, могла бы создать трудности в обеспечении условий повторяемости в период между измерениями, т.к. в этом случае необходимо, чтобы все q групп из п измерений были осуществлены в пределах короткого интервала времени.

d) Однако при использовании основного метода «в чистом виде» не обязательно стремиться к тому, чтобы все q групп из п измерений были проведены в пределах короткого интервала времени; различные группы измерений могут проводиться в разные дни.

e) Измерения для всех q уровней должны выполняться одним и тем же оператором, и, кроме того, п измерений на данном уровне должны выполняться с использованием одного и того же оборудования.

f) Если в процессе измерений оператор не сможет их выполнить полностью, измерения может завершить другой оператор при условии, что замена оператора не произойдет в пределах группы из п измерении на одном уровне, т.е. замены операторов могут происходить лишь при переходе от одного уровня к другому. Любое такого рода изменение должно регистрироваться вместе с результатами.

g) Должен быть задан временной интервал проведения измерений, т.е. время между датой получения проб и датой завершения всех измерений.

h) Все пробы должны быть отчетливо промаркированы с указанием названия эксперимента и шифра пробы.

2. В 1 и других пунктах настоящего стандарта упоминается оператор. В действительности некоторые измерения может проводить группа операторов, каждый из которых выполняет какую-то специфическую часть процедуры. В этом случае группа должна рассматриваться как «оператор», и любое изменение в группе должно восприниматься как смена «оператора».

3. В коммерческой практике (торговле) результаты измерений (испытаний) могут округляться довольно грубо, однако в эксперименте по оценке прецизионности результаты должны регистрироваться (вычисляться) с точностью, по меньшей мере на один знак большей, чем количество значащих цифр, установленное для регистрации результатов измерений (испытаний) стандартным методом. Если метод не устанавливает количество значащих цифр, округление не должно быть грубее половины оценки стандартного отклонения повторяемости. Когда прецизионность зависит от уровня т, для различных уровней могут потребоваться различные степени округления.

4.8.2 Проверка воспроизводимости эксперимента.

Основная цель ТПЭ — построение математической модели исследуемого в экс­перименте процесса. Чтобы воспользоваться методами ТПЭ, нужно сначала убе­диться, что эксперимент воспроизводим.

Прецизионность (воспроизводимость) – степень близости друг к другу независимых результатов измерений, полученных в конкретных условия.

Под воспроизводимыми экспериментами понимаются такие, в процессе кото­рых в любой момент времени объект исследования и измерительное оборудова­ние можно вернуть в исходное состояние и эксперимент повторить. Например, испытывая двигатель и снимая его характеристики, можно предположить, что в любой момент или за относительно короткий отрезок времени можно вернуться к исходному режиму и воспроизвести его практически без каких-либо изменений.

Большинство экспериментов в науке и технике относится к невоспроизводи­мым. Наиболее яркий пример - исследование изнашивания детали какого-либо узла машины при испытаниях ее на надежность.

В процессе лабораторного или эксплуатационного эксперимента объект иссле­дования деформируется, меняя форму, или уменьшается в размерах. Такое про­грессирующее ухудшение технического состояния объекта исследований не по­зволит исследователю воспроизвести состояние, в котором объект был в начале исследования.

Для проверки воспроизводимости эксперимента проводят несколько серий па­раллельных опытов.

Параллельные опыты - опыты, проведенные несколько раз при одних и тех же значениях факторов. Результаты опытов заносятся в таблицу 2.1, где к - число параллельных опытов (обычно к = 2...4); N - число серий параллельных опытов.

Для каждой серии параллельных опытов вычисляют среднее арифметическое значение функции отклика по формуле (4.29)

, (4.29)

где n – количество параллельных опытов.

Отклонение результата любого опыта от среднего арифметического можно представить как разность (4.30).

, (4.30)

где yq – результат отдельного опыта.

Наличие отклонения свидетельствует об изменчивости, вариации значений повторных опытов. Для измерения этой изменчивости чаще всего используют дисперсию. Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения. Дисперсия обозначается s2 и выражается формулой (4.31).

, (4.31)

где n – 1 - число степеней свободы, равное количеству опытов минус единица. Одна степень свободы использована для вычисления среднего.

Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратическим отклонением, стандартом или квадратичной ошибкой

. (4.32)

Стандарт имеет размерность той величины, для которой он вычислен. Дисперсия и стандарт – это меры рассеяния, изменчивости. Чем больше дисперсия и стандарт, тем больше рассеяны значения параллельных опытов около среднего значения.

Среднее арифметическое равно сумме всех n отдельных результатов, деленной на n, если они имеют нормальное распределение.

Наличие резко отклоняющихся результатов (грубых наблюдений) свидетельствует о нарушении закона нормального распределения.

При наличии грубых наблюдений их необходимо сначала исключить, а затем подсчитывать среднее арифметическое и дисперсию.

Ошибка опыта являемся суммарной величиной, результатом многих ошибок: ошибок измерений факторов, ошибок измерений параметра оптимизации и др. Каждую из этих ошибок можно, в свою очередь, разделить на составляющие.

Вопрос о классификации ошибок довольно сложный и вызывает много дискуссий. В качестве примера одной из возможных схем рассмотрим схему из книги Ю. В. Кельница «Теория ошибок измерений» (М., изд-во «Недра», 1967) изображенную на рисунке 4.13.

Рисунок 4.13 – Классификация ошибок измерения

Все ошибки принято разделять на два класса: систематические и случайные.

Систематические ошибки порождаются причинами, действующими регулярно, в определенном направлении. Чаще всего эти ошибки можно изучить и определить количественно.

Систематические ошибки находят, калибруя измерительные приборы и сопоставляя опытные данные с изменяющимися внешними условиями (например, при градуировке термопары по реперным точкам, при сравнении с эталонным прибором).

Если систематические ошибки вызываются внешними условиями (переменной температуры, сырья и т. д.), следует компенсировать их влияние. Как это делать, будет показано ниже.

Случайными ошибками называются те, которые появляются нерегулярно, причины возникновения которых неизвестны и которые невозможно учесть заранее.

Систематические и случайные ошибки состоят из множества элементарных ошибок. Для того, чтобы исключать инструментальные ошибки, следует проверять приборы перед опытом, иногда в течение опыта и обязательно после опыта. Ошибки при проведении самого опыта возникают вследствие неравномерного нагрева реакционной среды, разного способа перемешивания и т.п. При повторении опытов такие ошибки могут вызвать большой разброс экспериментальных результатов.

Очень важно исключить из экспериментальных данных грубые ошибки, так называемый брак при повторных опытах. Для отброса ошибочных опытов существуют правила. Для определения брака используют, например, критерий Стьюдента

, (4.33)

где yq – предположительный брак выборки;

- среднее арифметическое выборки без бракованного значения;

s – стандарт (квадратичная ошибка) выборки без брака.

Значение t берут из таблицы t-распределения Стьюдента (Приложения В). Опыт считается бракованным, если экспериментальное значение критерия tэксп по модулю больше табличного значения.

Пример. При исследовании процесса коррозии четыре повторных опыта показали следующие значения скорости коррозии:

3,580, 2,370, 2,710 и 2,761 мг/см2·час.

Результат первого опыта поставлен под сомнение, так как он выделяется на фоне остальных трех опытов.

Исключим первый опыт из расчета и по остальным произведем вычисление среднего арифметического и стандарта:

ΔyI = 2,370 – 2,613 = -0,243

ΔyII = 2,710 - 2,613 = 0,097

ΔyIII = 2,761 - 2,613 = 0,148

Если произведем проверку по критерию Стьюдента, то получим:

При числе степеней свободы f=2 и уровне значимости 0,05 (95%) t=4,303. экспериментальное значение больше табличного, поэтому сомнительный результат можно считать браком.

4.8.3 Дисперсия параметра оптимизации.

Дисперсия всего эксперимента получается в результате усреднения дисперсий всех опытов. По терминологии, принятой в планировании эксперимента, речь идет о подсчете дисперсии параметра оптимизации s2{y} или, что то же самое, дисперсии воспроизводимости эксперимента s2воспр.

При подсчете дисперсии параметра оптимизации по формуле (4.34), квадрат разности между значением yq в каждом опыте и средним значением из n повторных наблюдений y нужно просуммировать по числу опытов в матрице N, а затем разделить на N(n - 1):

, (4.34)

где i = 1, 2, …, N;

q = 1, 2, …, n.

Такой формулой можно пользоваться в случаях, когда число повторных опытов одинаково во всей матрице.

Дисперсию воспроизводимости проще всего рассчитывать, когда соблюдается равенство числа повторных опытов во всех экспериментальных точках. На практике весьма часто приходится сталкиваться со случаями, когда число повторных опытов различно. Это происходит вследствие отброса грубых наблюдений, неуверенности экспериментатора в правильности некоторых результатов (в таких случаях возникает желание еще и еще раз повторить опыт) и т.п.

Тогда при усреднении дисперсий приходится пользоваться средним взвешенным значением дисперсий, взятым с учетом числа степеней свободы

, (4.35)

где - дисперсия первого опыта;

- - дисперсия второго опыта и т.д.;

f1 – число степеней свободы в первом опыте, равное числу параллельных опытов n1 минус 1, т.е.

f1 = n1 – 2, (4.36)

f2 – число степеней свободы во втором опыте и т.д.

Число степеней свободы средней дисперсии принимается равным сумме чисел степеней свободы дисперсий, из которых она вычислена.

Случай с неравным числом наблюдений, который мы рассмотрели выше, связан с нарушением ортогональности матрицы. Поэтому здесь нельзя использовать расчетные формулы для коэффициентов, приведенные ранее. Этот вопрос будет рассмотрен ниже.

Экспериментатору не следует забывать о проверке однородности дисперсий, неоднородные дисперсии усреднять нельзя. Прежде чем пользоваться приведёнными выше формулами, нужно убедиться в однородности суммируемых дисперсий.

4.8.4 Проверка однородности дисперсий.

Проверка однородности дисперсий производится с помощью различных статистических критериев.

- критерий Фишера, предназначенный для сравнения двух дисперсий (s=2, );

- критерий Кохрана, если сравниваемое количество дисперсий больше двух, но при одинаковом числе повторных опытов (s > 2, n = const);

- критерий Бартлера, если сравниваемое количество дисперсий больше двух, при разном числе повторных опытов (s > 2, n ≠ const).

Простейшим из них является критерий Фишера, предназначенный для сравнения двух дисперсий. Критерий Фишера (F-критерий) представляет собою отношение большей дисперсии к меньшей (формула 4.37). Полученная величина сравнивается с табличной величиной F-критерия.

. (4.37)

Если полученное значение дисперсионного отношения больше приведенного в таблице (приложения Г) для соответствующих степеней свободы и выбранного уровня значимости, это означает, что дисперсии значимо отличаются друг от друга, т. е. что они неоднородны.

Пример. Пусть s12=5,14, n1=7 и f1=6; s22=0,324, n2=6 и f2=5. в данном примере отношение дисперсий равно

Если сравниваемое количество дисперсий больше двух и одна дисперсия значительно превышает остальные, можно воспользоваться критерием Кохрена. Этот критерий пригоден для случаев, когда во всех точках имеется одинаковое число повторных опытов. При этом подсчитывается дисперсия в каждой горизонтальной строке матрицы по формуле (4.31):

а затем из всех дисперсий находится наибольшая s2max которая делится на сумму всех дисперсий. Критерий Кохрена – это отношение максимальной дисперсии к сумме всех дисперсий, формула (4.38).

. (4.38)

С этим критерием связаны числа свободы:

- f1 = n – 1,

- F2 = N.

Гипотеза об однородности дисперсий подтверждается, если экспериментальное значение критерия Кохрена не превышает табличного значения (Приложение Д). Тогда можно усреднять дисперсии и пользоваться формулой (4.34) воспроизводимости дисперсий:

.

Пример. Результаты эксперимента с 2я повторными опытами

y'

y''

Δy

(Δy)2

s2i

1

80,23

81,93

81,08

-0,85

0,722

1,44

2

86,50

84,80

85,65

0,85

0,722

1,44

3

82,45

82,10

82,27

0,18

0,031

0,062

4

89,50

91,30

90,40

-0,90

0,810

1,620

5

85,10

84,80

84,95

0,15

0,023

0,046

6

90,30

89,60

89,95

0,35

0,123

0,246

7

85,60

84,90

85,25

0,35

0,123

0,246

8

88,02

88,48

88,25

-0,23

0,053

0,106

2,607

Дисперсия в каждом опыте равна

.

Максимальная дисперсия оказалась в опыте №4.

Экспериментальный критерий Кохрена равен

Экспериментальный критерий Кохрена не превышает значения табличного. Гипотеза об однородности дисперсий подтверждается.

Дисперсия воспроизводимости равна

Если возникает предположение о наличии неоднородности дисперсий для случая, когда число повторных опытов неодинаково во всех точках, можно воспользоваться критерием Бартлета. По уже знакомой формуле (4.35) подсчитывается дисперсия воспроизводимости:

Далее находится величина по формуле (4.39).

, (4.39)

где c определяется по формуле (4.30)

. (4.40)

Здесь число степеней свободы равно N-1, где N – число сравниваемых дисперсий. При планировании эксперимента типа 2k это число равно числу опытов в матрице.

Бартлет показал, что величина приближенно подчиняется χ2 – распределению с (N–1) степенями свободы. Значимость критерия Бартлета проверяется обычным способом.

Критерий Бартлета базируется на нормальном распределении. Если имеются отклонения от нормального распределения, то проверка неоднородности дисперсий может привести к ошибочным результатам.

Можно предложить использование F-критерия даже в тех случаях, когда число дисперсий больше двух. Делается это следующим образом. Из всех дисперсий выделяются наибольшая и наименьшая. По F-критерию производится проверка, значимо ли они различаются между собой. Ясно, что если наибольшая и наименьшая дисперсии не отличаются значимо, то дисперсии, имеющие промежуточные значения, также не могут значимо отличаться друг от друга. Тогда всю группу дисперсий можно считать принадлежащей к единой совокупности. В таких случаях нет надобности применять критерий Бартлета.

4.8.5 Рандомизация.

Чтобы исключить влияние систематических ошибок, вызванных внешними условиями (переменой температуры, сырья, лаборанта и т. д.), рекомендуется случайная последовательность при постановке опытов, запланированных матрицей. Опыты необходимо рандомизировать во времени. Термин «рандомизация» происходит от английского слова random – случайный.

Почему рандомизация опытов важна, мы попытаемся показать на следующем примере.

Рассмотрим матрицу 23, полученную из матрицы 22 обычным способом: два раза повторен план 22, причем в первых четырех опытах x3 имеет верхнее значение, а в последних четырех опытах – нижнее значение. Допустим, что экспериментатор может поставить в первый день четыре опыта и во второй день также четыре опыта.

Таблица 4.13 - Матрица планирования 23 с ошибкой

№ опыта

x1

x2

x3

y

1

+

+

+

y1

2

-

+

+

y2

3

+

-

+

y3

4

-

-

+

y4

5

+

+

-

Y5

6

-

+

-

Y6

7

+

-

-

Y7

8

-

-

-

Y8

Можно ли опыты ставить подряд и в первый день реализовать опыты № 1, 2, 3 и 4, а во второй – 5, 6, 7 и 8? Ставя опыты подряд, вы разбиваете матрицу на две части или на два блока: в первый блок – входят опыты № 1, 2, 3 и 4, во второй – № 5, 6, 7 и 8. Если внешние условия первого дня каким-то образом отличались от внешних условий второго дня, то это способствовало возникновению некоторой систематической ошибки. Обозначим эту ошибку ε. Тогда четыре значения параметра оптимизации сдвинуты на величину ε по сравнению с истинными значениями. Пусть это будут параметры, входящие в первый блок: y1+ε, y2+ε, y3+ε, y4+ε. Однако матрица построена так, что в первом блоке значения х3 находятся на верхнем уровне, а во втором – на нижнем уровне. Тогда при подсчете b3 получится следующая картина:

b3= [(y1+ε)+(y2+ε)+(y3+ε)+(y4+ε)–y5–y6–y7–y8]→β3+ . (4.41)

где β3 – истинное значение коэффициента при х3.

Таким образом, возможное различие во внешних условиях смешалось с величиной линейного коэффициента b3 и исказило это значение. В такой последовательности опыты ставить нельзя. Опыты нужно рандомизировать во времени, т.е. придать последовательности опытов случайный характер.

37

56

32

72

42

21

33

40

99

17

95

57

58

0

21

19

50

71

32

90

22

31

66

7

39

8

63

55

89

98

5

1

48

44

92

72

84

36

0

51

77

69

63

51

90

87

90

84

5

90

20

46

48

41

2

61

47

99

80

82

68

35

81

20

43

18

5

35

79

49

32

17

71

58

54

21

8

70

20

90

47

87

77

16

17

98

60

47

42

48

63

66

90

72

80

80

37

55

2

33

75

98

9

30

13

38

33

22

49

65

39

93

82

99

74

19

50

37

36

94

70

3

24

46

63

75

57

10

48

34

10

24

9

18

37

42

34

24

17

51

77

96

44

89

95

76

91

8

49

73

75

5

97

54

67

10

10

52

57

83

50

51

87

90

86

7

92

32

96

46

32

96

44

17

26

34

92

27

9

67

80

97

67

41

41

43

26

56

52

78

23

16

27

2

30

46

96

84

82

14

19

20

64

30

71

2

16

76

77

63

36

16

23

1

45

67

0

7

67

81

18

39

73

45

52

75

50

51

53

78

88

87

11

71

36

59

40

9

99

58

90

17

26

71

60

84

55

64

96

52

26

12

41

9

24

60

14

17

43

54

43

75

30

1

42

56

57

45

99

40

8

93

18

69

41

77

62

23

91

24

31

99

86

62

15

45

95

85

74

20

75

33

68

50

55

29

10

40

12

3

46

100

68

87

88

90

72

30

15

93

47

34

68

31

69

75

63

61

35

99

12

76

5

1

8

44

71

39

46

11

14

15

85

68

83

21

20

0

92

75

97

18

90

4

27

11

14

50

17

23

90

69

38

76

16

95

88

38

40

29

97

28

61

36

50

51

64

49

35

29

67

39

26

18

42

86

69

72

1

72

81

34

66

85

41

36

50

10

10

49

62

34

3

44

24

39

71

45

55

14

5

25

26

57

18

11

42

37

58

3

41

91

38

83

18

1

81

78

15

79

4

19

26

48

64

89

81

46

99

95

62

97

81

71

48

51

18

4

51

76

48

51

29

59

15

49

56

90

42

56

31

99

6

76

66

95

58

65

9

86

59

86

46

1

50

21

71

23

16

52

76

39

60

47

52

24

21

0

85

60

50

90

92

75

68

20

38

16

100

54

29

87

81

98

47

36

46

27

82

13

82

12

69

41

11

41

78

64

22

48

29

74

61

2

14

38

58

47

14

64

18

65

78

51

57

68

88

73

22

17

76

58

16

51

31

8

24

15

92

6

6

81

62

47

37

39

62

52

45

47

58

26

59

52

24

91

89

66

26

15

81

17

54

57

82

41

42

70

38

58

62

100

8

53

97

9

9

86

80

87

4

45

43

22

71

77

56

21

91

56

82

33

13

13

4

11

98

98

29

46

Приведем простой пример рандомизации условий эксперимента. В полном факторном эксперименте 23 предполагается каждое значение параметра оптимизации определять по двум параллельным опытам. Нужно случайно расположить всего 16 опытов. Присвоим параллельным опытам номера с 9 по 16, и тогда опыт № 9 будет повторным по отношению к первому опыту, десятый – ко второму и т. д. Следующий этап рандомизации – использование таблицы случайных чисел. Обычно таблица случайных чисел приводится в руководствах по математической статистике. В случайном месте таблицы выписываются числа с 1 по 16 с отбрасыванием чисел больше 16 и уже выписанных. В нашем случае, начиная с четвертого столбца, можно получить такую последовательность:

2; 15; 9; 5; 12; 14; 8; 13; 16; 1; 3; 7; 4; 6; 11; 10.

Это значит, что первым реализуется опыт № 2, вторым – опыт № 7 и т.д. Выбранную случайным образом последовательность опытов не рекомендуется нарушать.