Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Оптимизация эксперимента в химии и химической технологии

..pdf
Скачиваний:
31
Добавлен:
15.11.2022
Размер:
14.6 Mб
Скачать

то

 

 

 

М [X] = а.

 

(Н.ЗО)

В дальнейшем будут рассматриваться только

случайные

ошибки

измерений.

 

 

 

 

 

5.

Закон сложения ошибок. Для независимых случайных величин

свойством аддитивности обладают дисперсии,

а не среднеквадра­

тичные ошибки. Если Хи %2 , ...,

Хп— независимые случайные ве­

личины; а\уй2 У..., ап — неслучайные величины и

 

 

 

 

Z — а\Х\ + &2Х 2 ■+■ • • • + апХп»

 

(11.31)

то выборочная дисперсия величины Z определится следующим об­

разом:

 

 

 

 

 

 

 

 

SZ =

alsXi “Ь

+ • • • + ая5Хл•

(II.32)

Если положить ах= а 2 — . . . = а п= — , то

 

 

 

 

 

 

п

 

 

 

 

Z Х \ + Х 2 -\- . . . 4- Х п _

 

 

 

 

 

п

 

 

 

В этом случае

 

 

 

 

 

 

.2_

SXy + s x 2 +

• • • + s x n

 

(11.33)

 

 

Л2

п

 

 

X

 

 

2

4 ,

 

 

 

 

г д е 5 V

= —

-------.

 

 

 

 

ЛТ1

Если величины Х\, Х2, ..., Хп интерпретировать как п независимых наблюдений одной и той же случайной величины X, то 4 i = s x .=

2

2

= • •. = s x n= sx - Тогда получим

4

(11.34)

 

Из выражения (11.34) следует практический вывод: при оценке точ­ ности двух методов следует учитывать длительность анализа. При­ меняя менее точный экспресс-метод, можно сделать за то же время значительно большее число опытов и добиться более высокой точ­ ности, чем даст трудоемкий точный метод.

6. Ошибки косвенных измерений. Измерения делят на прямы и косвенные. В первом случае непосредственно измеряется опреде­ ляемая величина, при косвенных измерениях она задается некоторой функцией от непосредственно измеряемых величин. Пусть случай­ ная величина z зависит от наблюдений Х\9 , хп по известному за­ кону:

* = / (■*!» .............

х п).

Истинное значение величины z может не совпадать с математиче­ ским ожиданием Mz, а определяться тем же законом

= / ( тх , > тх г ’ ‘ " > тх , } ‘

Величина az называется средним косвенного измерения.

Дисперсия косвенного измерения oz определяется так же, как обычная дисперсия, только отклонения берутся от среднего косвен­ ного измерения az. Ее можно найти, зная дисперсии отдельных на­ блюдений и вид функции f. На практике определяют выборочные

дисперсии в*, и по ним выборочную дисперсию косвенного изме­ рения sz2, которая служит оценкой генеральной дисперсии аД Что­

бы найти sz2, разложим функцию z=f(xi,

х2, ..., хп) в ряд Тейлора

в точке

(m *,,

mXi,..., тХ/), ограничиваясь

членами

первого

порядка

 

а/

 

 

 

 

 

 

 

я s a f ( m Xt, тх%.........тх ) + —

(:х 1— mXt) +

 

 

+

- ^ - ( Х2- т Х:) + . . . + - ± L (Xn- m

x )

(П.35)

и определим sz2 по закону сложения дисперсий:

5

2

(11.36)

г

Выражение (11.36) учитывает возможную взаимную компенсацию

ошибок измерения. Иногда

его

называют

законом накопления

ошибок.

 

 

 

 

 

Пример 1. Оценить ошибку определения линейной

скорости движения газа

в трубопроводе и, пользуясь следующими

результатами измерений: количество

газа

6=3000 м3/ч; ошибка

измерения s o = 10 м3/ч; сечение трубопровода

F =

=0,1

м2; ошибка измерения s* = 1 см2.

скорость как результат косвенного

из­

Р е ш е н и е . Рассматривая линейную

мерения

 

 

 

 

 

 

G

3000

= 30000 м/ч = 8,82 м/с,

 

 

v = —

= —

 

определим sv по формуле (11.36):

 

 

_G2

 

*•“ V [ l a ) + ( TF ) sr = V F2 s°

F* SP =

 

V 1-10-2.102+ 9-106-10-8

 

 

= 0,03 м/с.

 

1-10-2-3600

 

7.

Определение дисперсии по текущим измерениям. Математи­

ческое ожидание (среднее) и дисперсия генеральной совокупности оцениваются средним и дисперсией'выборки тем точнее, чем боль­ ше объем выборки. При этом среднее характеризует результат из­ мерений, а дисперсия — точность этого результата (дисперсия вос-

производимости) (см. гл. II, § 4). Если проделано m параллельных опытов (опытов, проведенных при неизменном комплексе основных факторов) и получена выборка у\, у2 , ..., Ут значений измеряемой величины, то дисперсия воспроизводимости равна

S (Уи ~~У)2

и-1

5воспр

2 уи

— М—1

где у = ---------- ,

т

и ошибка опыта (ошибка воспроизводимости)

2

^ВОСПр воспр*

Часто для оценки точности применяемой методики ставят спе­ циальную серию опытов, многократно повторяя анализ одной и той же пробы. На проведение большой серии опытов требуется много времени, в течение которого может неконтролируемым образом из­ мениться среднее значение результатов анализа. Значительно про­ ще и удобнее определять ошибку воспроизводимости по текущим измерениям.

Предположим, анализируются п проб. При анализе каждой пробы делается различное число параллельных опытов: тл, т2, ..., тп. Вычислим частные дисперсии si2, s22, ..., sn2 для каждой такой выборки в отдельности. Число степеней свободы частных дисперсии соответственно равно: f\ = m1—1, f2=m2—1, ..., fn=m „—1. Общая дисперсия воспроизводимости всех опытов будет равна средневзве­ шенному значению частных дисперсий (в качестве весов берутся степени свободы):

2

fis \ 4- f 2s\ +

... + /л 5л

5в0СПР =

/1 + /2 +

... + /я

(mi — 1) s? + (т2— 1) s\ + ... + (m„ — 1) s i

 

tni + m2 +

(11.37)

 

+ mn n

Число степеней свободы общей дисперсии равно общему числу из­ мерений -минус число связей, использованных для определения п средних:

П

/воспр == Ш\ + т2+ ... + тпП = 2 т — п. (11.38) /-1

Учитывая, что частные дисперсии опредёляются по результатам па­ раллельных опытов по формуле

2

{Ут — Ул)2

s7 = и-1

/«■1, 2...... л,

из (11.37) имеем

(mi — 1) s, + (m2 — 1)s| + ... + (m„ — 1) s%-v

5воспр

Щ + m2+ + mn — n

 

n n

1

2

У№ „ mt

2

( т , — l)s?

2

(mi — 1) —

-----------------

2 2 111— У1)2

 

i -

1____________

/ - i

_________

r n i — 1

i - i n - i

(11.39)

 

 

 

 

 

 

i2-i mi - n

/- 1

t2-i m/~~л

 

2 m — n

 

Если число параллельных опытов при анализе каждой пробы оди­ наково, т{ = т2= =тп= т формулы для расчета дисперсии вос­ производимости упрощаются. При этом

 

(m — 1) (s2 + $1 + ... + s2n)

(m— 1) 2 s?'

2 s?

 

^воспр

/-1

/ - 1

(11.40)

mn — л

л (m— 1)

 

 

 

Таким образом, при равном числе параллельных опытов общая дисперсия воспроизводимости равна среднеарифметическому зна­ чению частных дисперсий. Число степеней свободы общей диспер­ сии при этом равно

/вослР =

п ( т — 1).

(11.41)

И окончательно

 

 

п

т

 

2

2 (ytu—yi)2

 

s2воспр __ !-1

и- 1

(11.42)

 

п (т — 1)

 

Число степеней свободы у общей дисперсии воспроизводимости,

определяемой по формулам (11.39) и (11.42), гораздо

больше, чём

у каждой частной дисперсии в отдельности. Поэтому

общая дис­

персия воспроизводимости намного точнее оценивает дисперсию генеральной совокупности а2ВОспр.

При вычислении дисперсии воспроизводимости по текущим из­ мерениям объединяют между собой только те пробы, которые мож­ но рассматривать как выборки йз генеральных совокупностей с равными дисперсиями. При этом каждое из значений $i2, s22, ..., sn2 можно рассматривать как оценку для одной и той же генераль­ ной дисперсии.

Пример 2. Результаты определения концентрации (%) РгОб в системе (ЫЬЦЬНРО*—К2СО3—Н20 колориметрическим методом приведены в таблице.

Определить ошибку колориметрического метода по текущим измерениям.

Номер

 

 

 

Номер пробы

 

 

 

опыта

1

2

3

4

5

6

7

8

 

 

 

1

27,9

19,3

4,5

22,3

10,8

16,3

8,8

12,6

 

2

27,2

19,7

5,2

23,5

8,9

15,8

8,7

13,5

 

3

26,8

4,8

21,7

 

17,2

9,2

13,3

' 2

у* '

81,9

39,0

14,5

67,5

19,7

49,3

26,7

39,4

2

у1

2236,49

760,58

70,69

1520,43

195,85

811,17

237,77

517,90

 

Щ

3

2

3

3

2

| 3

3

3

 

 

 

 

 

 

 

 

 

Р е ш е н и е . По данным таблицы вычислим s *2 по формуле

L u-i J

Для вычисления общей дисперсии по формуле (11.37) понадобятся слагае­

мые вида

 

 

 

 

 

 

^

 

 

т 1

(

т 1

 

\ 2

 

 

 

2

* « )

 

 

 

 

 

s]{mi— 1)

V

и 2

\ ц = 1

 

/

 

П1

 

 

 

L И-1

 

 

Для первой пробы имеем

 

 

 

 

 

 

 

 

 

 

 

l ) 5i = 2236,49 —

 

 

_

(^62.

Аналогично

 

 

 

 

 

 

 

(/7^2 — 1)^2 =

0,08;

(/тг31) si =

0,61;

(/7741) $4 = 1,68;

(ms— 1 )Sg =

1,805;

(/тгб — l ) s | =

1,01; (/тг7— l)sy =--0,14;

 

 

( т 8— 1)58=

0,045.

 

 

Число степеней свободы общей дисперсии воспроизводимости равно

 

8

 

8

 

 

 

 

/ воснр = S

f I =

2

8

= 2 2

8 = 14.

 

i- 1

/-1

 

 

 

 

И дисперсия воспроизводимости

 

 

 

 

 

 

 

/ - 1

5 , 9 9

=

0,4279.

 

'воснр

х

 

А Л

 

 

J воснр

А**

 

 

 

Ошибка колориметрического метода, определенная по текущим измерениям, равна

^ВОСИр =V: 4с,.р = /0,49.79 = 0,654.

8. Доверительные интервалы и доверительная вероятность. Вы­ борочные параметры являются случайными величинами, их откло­ нения от генеральных (погрешности) также будут случайными. Оценка этих отклонений носит вероятностный характер — можно лишь указать вероятность той или иной погрешности. Для этого в математической статистике пользуются доверительными интервала­ ми и доверительными вероятностями.

Пусть для генерального параметра а получена из опыта несме­ щенная оценка а*. Нужно оценить возможную при этом ошибку. Назначим достаточно большую вероятность р, такую, что событие с вероятностью р можно считать практически достоверным, и най­

дем такое значение e=f (р) =ер, для которого

х

/ > ( | а * - а | < . р) = р.

(11.43)

При этом диапазон практически, возможных значений ошибки, воз­ никающей при замене а на а*, будет ±ер, большие по абсолютной величине ошибки будут появляться только с малой вероятностью

Р= 1 -Р ,

(11.44)

называемой уровнем значимости. Уровень значимости часто выра­ жают в процентах. Иначе выражение (11.43) может быть интерпре­ тировано как вероятность того, что истинное значение параметра а лежит в пределах

а*— ер<а<* + Ер.

(11.45)

Вероятность р называется доверительной вероятностью, она харак­ теризует надежность полученной оценки. Интервал /р=а*±ер назы­ вается доверительным интервалом. Границы интервала а'—а*—ер и а"=а* + ер называются доверительными границами. Доверитель­ ный интервал при данной доверительной вероятности определяет точность оценки. Величина доверительного интервала зависит от доверительной вероятности, с которой* гарантируется нахождение параметра а внутри доверительного интервала: чем больше вели­ чина р, тем больше и величина ер (т. е. чем с большей надежностью хотим гарантировать полученный результат, тем в большем интерва­ ле значений он может находиться). Увеличение числа опытов про­ является в сокращении доверительного интервала при постоянной доверительной вероятности или в повышении доверительной вероят­ ности при сохранении доверительного интервала. Обычно на прак­ тике фиксируют на определенном уровне значение доверительной вероятности (0,9, 0,95 или 0,99) и исходя из этого определяют до­ верительный интервал результата /р. При построении доверитель­ ного интервала решается задача об абсолютном отклонении.

+«р

/> ;(|а * -а | < ер) = Р(Да<ер) = Г(ер) - / г( - ер) = J f(x)dx=?. (П.46)

-«р

Таким образом, если бы был известен закон распределения оценки а*, задача определения доверительного интервала решалась

просто. Рассмотрим в качестве такого примера построение довери­ тельного интервала для математического ожидания нормально распределенной случайной величины X с известным генеральным стандартом, равным а*.

Пусть имеется выборка объема п значений этой случайной ве­ личины. Наилучшей оценкой для тх является среднее выборки х :

П

2 xi

1~1-

х= --------.

п

Для построения доверительного интервала необходимо знать распределение этой оценки. Для выборок из генеральной совокуп­ ности, распределенной нормально, можно показать (например, ис­ пользуя свойство линейности нормального распределения), что * также имеет нормальное распределение со средним значением тх

и средним квадратическим отклонением

• Тогда, неполн­

ую п

 

зуя функцию Лапласа согласно (1.68), получим

 

Р ( I х — тх \ < ер) = р = 2Ф ^"71^ •

(И-47)

Задавшись доверительной^вероятностью р, определим по таблицам

функции Лапласа fep = ep/ox. Тогда доверительный интервал-для ма­ тематического ожидания будет иметь вид

x — k ^ i - < т х < х + £ро _ ,

или

х

°х_ < тх < х

°х_ .

(11.48)

 

У Т1

У п

 

Из этой оценки видно, что уменьшение доверительного интервала обратно пропорционально корню квадратному из числа наблюде­ ний. Следовательно, если надо уменьшить возможную ошибку в. два раза, необходимо увеличить число наблюдений в четыре раза.

Знание генеральной дисперсии ах позволяет оценивать мате­ матическое ожидание даже по одному наблюдению. Если для нор­ мально распределенной случайной величины X в результате экспе­ римента получено значение х\, то доверительный интервал для ма­ тематического ожидания с доверительной вероятностью р=1—р имеет вид

xi — аа

р < mx < xi + ои

р ,

(11.49)

1

2

1_

2

 

где и i_£ — квантиль стандартного

нормального

распределения.

г

 

 

 

 

Стандартное нормальное распределение симметрично относительно

нуля, поэтому ttJL = ~

2 2

Пример 3. Среднее значение температуры печи, полученное по четырем неза­ висимым измерениям оптическим пирометром, 2250° С. Ошибка при этом методе измерения 10° С. Найти с надежностью 95% доверительные границы, внутри которых лежит истинное значение измеряемой температуры.

Решение. Полагая, что ошибка измерения — это известный генеральный стандарт а* = 10° С и что случайная величина X (температура печи) распределена нормально, по формуле (11.49) имеем

2250 — kQ—~~ < т х < 2250 + k0 — .

Р 1/4 V 4

При (3=95%, ftp =1,96 и, следовательно, истинное значение измеряемой темпера­ туры находится с надежностью 95% в следующих доверительных границах:

2240,2 < /и, <2259,8.

Закон распределения оценки а* зависит от закона распределе­ ния случайной величины X, в частности от самого параметра а. Чтобы обойти это затруднение, в математической статистике приме­

няют обычно два метода: 1) приближенный: при л ^ 5 0

заменяют

в выражении для ер неизвестные параметры

их оценками; 2) от

случайной величины а* переходят к другой

случайной

величине,

закон распределения которой не зависит от оцениваемого парамет­ ра а, а зависит только от объема выборки п и от вида закона рас­ пределения величины X. Такого рода величины наиболее подробно

изучены для нормального распределения

случайной величины X.

В качестве доверительных границ а' и а"

берут обычно симмет­

ричные квантили

 

 

я*_р < л < а * +р

(11.51)

~~2~

~2~

 

или с учетом (11.44)

 

 

а р < а < а*

р .

(11.52)

Т1— Т

9.Проверка статистических гипотез. Под статистическими гипо­ тезами понимаются некоторые предположения относительно рас­ пределений генеральной совокупности той или иной случайной ве­ личины. Проверка гипотезы заключается в сопоставлении некото­ рых статистических показателей, критериев проверки (критериев значимости), вычисляемых по выборке, со значениями этих показа­ телей, определенными в предположении, что проверяемая гипотеза верна. При проверке гипотез подвергается испытанию_некоторая гипотеза Но в сравнении с альтернативной гипотезой Н , которая

формулируется или подразумевается. Альтернативных гипотез мо­ жет быть несколько.

Чтобы принять или отвергнуть гипотезу, еще до получения вы­ борки задаются уровнем значимости р. Наиболее употребительны уровни значимости 0,05; 0,02; 0,01; 0,10; 0,001. Уровню значимости соответствует доверительная вероятность р=1—р. По этой вероят­ ности, используя гипотезу о распределении оценки 0* (критерия

значимости), находят квантильные доверительные границы, как правило, симметричные бр /2 и 0i_p/2. Числа 0р/2 и 0i-p/2 назы­ ваются критическими значениями гипотезы; значения 0*, меньшие,

чем др/2 , и большие 0 i - P/2 ,

образуют критическую область ги­

потезы, или область непринятия

гипотезы (рис._16). Если

найден­

ное по выборке значение 0о попадает между 0 i/2 и 0 i_ p/2 >

то ги­

потеза допускает такое значение в качестве случайного, и поэтому нет оснований ее отвергать. Если же найденное значение 0о попа­ дает в критическую область, то по данной гипотезе оно является практически невозможным. Но так как оно все-таки появилось, то отвергается гипотеза.

Рис. 16. Критическая область ги­

Рис. 17. Проверка статистических

потезы

гипотез

При проверке гипотез можно совершать ошибки двух типов. Ошибка первого рода состоит в том, что отвергается гипотеза, ко­ торая на самом деле верна. Вероятность такой ошибки не больше принятого уровня значимости. Например, при р = 0,05 можно со­ вершить ошибку первого рода в пяти случаях из ста. Ошибка вто­ рого рода состоит в том, что гипотеза принимается, а на самом деле она неверна. Вероятность ошибки, второго рода зависит от характе­ ра проверяемой гипотезы, от способов проверки и от многих других

причин, что сильно усложняет ее оценку.

Эта вероятность тем меньше, чем выше уровень значимости, так как при этом увеличивается число отвергаемых гипотез. Одну и ту же статистическую гипотезу можно исследовать при помощи раз­ личных критериев значимости. Если вероятность ошибки второго рода равна а, то 1—а называют мощностью критерия. На рис. 17 приведены две кривые плотности вероятности случайной величины

. 0, соответствующие двум конкурирующим гипотезам Н(а) и Я (б). Если из опыта получается значение 0 > 0 Р, отвергается гипотеза Н и принимается альтернативная гипотеза Я, и наоборот, если 0< 0Р. Площадь под кривой плотности вероятности, соответствующей справедливости гипотезы Я вправо от 0Р, равна уровню значимо­ сти р, т. е. вероятности ошибки первого рода. Площадь под кривой вероятности, соответствующей справедливости Я влево от ир, рав­ на вероятности ошибки второго^рода а, а вправо от Up— мощности критерия. Таким образом, чем больше р, тем больше 1 я* Для проверки гипотезы стремятся из всех возможных критериев вы­ брать тот, у которого при заданном уровне значимости меньше

39

вероятность ошибки второго рода. Например, найдены два значе­ ния а\* и ач* некоторого выборочного параметра. Эти значения можно рассматривать как оценки генеральных параметров а\ и ач. Высказывается гипотеза, что различие между а.\* и ач* случайное и что генеральные параметры равны между собой, т. е. а\ = ач. Та­ кая гипотеза называется нулевой или нуль-гипотезой по термино­ логии Р. Фишера. Для. проверки этой гипотезы нужно выяснить, значимо ли расхождение между ai* и ач* в условиях нулевой гипо­

тезы.

Для этого обычно исследуют случайную

величину Ла* =

=ai*

ач* и проверяют, значимо ли ее отличие

от нуля. Иногда

удобнее рассматривать величину а\*1ач*, сравнивая ее с единицей. Отвергая нулевую гипотезу, тем самым принимают альтерна­ тивную. Альтернативная гипотеза распадается на две: 0 1 *>й2 * и а\*<ач*. Если одно из этих неравенств заведомо невозможно, то альтернативная гипотеза называется односторонней и для ее про­ верки применяются односторонние критерии значимости (в отли­ чие от обычных, двусторонних). При проверке гипотез очень важ­ но учесть априорную информацию о возможных значедшях оцени­ ваемых параметров, выяснить, что один из сравниваемых парамет­ ров не может быть больше другого. Иногда этот факт вытекает из постановки задачи. Например, изучая изменение чистоты реактива, заранее знаем, что в связи с разложением на свету чистота его с течением времени может только уменьшиться. Такая информация даст возможность при проверке гипотезы применить односторонний критерий значимости, который имеет меньшую ошибку второго

рода, чем соответствующий двусторонний.

Если известно, что одно из неравенств а1*>ач* или а\*<.ач* заведомо невозможно, то и рассматривать необходимо лишь одну

из половин критической области (см. рйс.

16). Например, р = 0,05

при двустороннем критерии соответствуют

критические

значения

0 о,о25 и 0 0 ,975, т. е. значимыми (неслучайными) считаются

0*, при­

нявшие значения 0*<0о,о25 и 0*>0о,975При одностороннем крите­ рии значимости одно из этих неравенств (например, 0 * < 0 o,o2s) заведомо невозможно незначимыми будут лишь 0*>0о,975. Вероят­ ность последнего неравенства равна 0,025, и, следовательно, уро­ вень значимости будет равен 0,025. Таким образом, если при одно­ стороннем критерии значимости использовать*те же критические числа, что и при двустороннем, этим значениям будет соответство­ вать вдвое меньший уровень значимости. Обычно для односторон-

него критерия берут тот*же уровень значимости, что и для двусто­ роннего. При этих условиях оба критерия обеспечивают одинаковую ошибку первого рода. Для этого односторонний критерий надо выводить из двустороннего, соответствующего вдвое большему

уровню значимости, чем тот, что принят. Чтобы сохранить для од­ ностороннего критерия уровень значимости р = 0,05, для двусторон­ него необходимо взять р=0,10, что дает критические значения: 0о,о5 и 0о,95. Из этих критических значений для одностороннего кри­ терия останется какое-нибудь одно, например 0О,95Уровень значи­ мости для одностороннего критерия равен при этом 0,05. Этому же-