Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Методы оптимизации эксперимента в химической технологии

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
13.27 Mб
Скачать
д2Р(х, а)

кого правдоподобия. Оценки, полученные при помощи этого метода, отвечают большинству изложенных требований.^Сущность метода максимального правдоподобия заключается в нахождении таких оценок неизвестных параметров, для которых функция правдоподобия при случайной выборке объема п будет иметь максимальное значение^ Пусть известен общий вид плотности вероятности f(x, а) теоретического Распределения; а неизвестный параметр, входящий в выражение закона Распределения. На опыте получена выборка значений случайной вели­ чины х }, х 2, хп. Окружим каждую точку х,- окрестностью длины е.

Вероятность попасть в интервал с границами xt

xi + ~ при­

2

ближенно равна f(xit а)е. Если произведено п наблюдений, то ве­ роятность, того, что одновременно первое наблюдение попадает в пер­ вый интервал, второе —во второй и т. д., есть вероятность совмест­ ного осуществления событий и в силу независимости событий равна произведению вероятностей;

Р(х, a) = f (Xl)f(x2) ... f(xn)z«.

(II.8)

Событие с вероятностью Р осуществилось на самом деле. Естественно ожидать, что событию, осуществившемуся при первом же испытании, со­ ответствует максимальная вероятность. Поэтому в качестве оценки для а следует взять то значение а* из области допустимых значений параметра я, для которого эта вероятность принимает наибольшее воз­ можное значение, т. е. корень уравнения

дР(х%а)

= 0,

(II.9)

да

\а=а*

 

представляющего собой необходимое условие экстремума вероят­ ности Р. Достаточным условием максимума при этом является выпол­ нение неравенства

да2

< 0 .

(11.10)

 

 

Если максимумов несколько, необходимо выбрать среди них наиболь­ ший. Решение проще получить, если перейти к функции

п

Ц х , а) ~ In ~

«)■

( И - 11)

i Si

которая называется функцией правдоподобия. Вероятность Р и функ­ ция L имеют максимумы при одних и тех же значениях определяемых параметров, так как

да In /> =

дР

п

(11.12)

Р ~да

, Я > 0 .

В общем случае требуется оценить одновременно несколько пара­ метров одномерного или многомерного распределения. Если а и х понимать как векторы, то формулировка принципа максимального правдоподобия сохранится: надо найти такую совокупность допустимых значений параметров я* , а* , , которая обращает функцию правдо-

подобия в максимум. Необходимые условия экстремума дает система уравнений

dL (xt ах

= 0, / = 1 , 2 ,

(11.13)

даг

 

 

а неотрицательная определенность матрицы

a2L

/ = 1,2,

(11.14)

(■doi даj

 

 

является достаточным условием того, чтобы локальный экстремум был максимумом функции правдоподобия.

Найдем методом максимального правдоподобия оценку парамет­ ра X показательного распределения с плотностью

/ ( * ) = Хе Хдг, 0 с JC < оо

по выборке хи х2, ..., хп.

Для этого распределения функция правдоподобия имеет вид

п

п

 

^ =

ХХ/) = л1пХ — 2 ^ / -

(11.15)

/=1

i=\

 

Дифференцируя (11.15) по А, и приравнивая производную нулю, получим уравнение

- Г - ■S =

откуда находим оценку А* параметраX:

А* =

п

 

(11.16)

2

 

»

f=l

 

или X* = 1 / х, где х среднее выборки.

Пусть распределение случайной величины X подчинено нормальному закону:

/(* ) =

1

ехр — ( х - т ?

|

У

2*о*

2оа

} *

 

 

Тогда вероятность совместного осуществления п независимых собы­ тий X=XjQ= 1, 2, ..., п) равна

Р(х, т ,

о2) =

ехр

 

(11.17)

 

(2*о2)П/2

 

*=1

 

 

 

 

 

и функция правдоподобия

 

 

 

Р

= — ——In 27i — —

In о2 — —

(11. 18)

L (Ху т , о2) — In —

ел

 

 

2оа

 

1= 1

Продифференцируем (11.18) по т и ст2;

dL 2 V I

Так как 1/а2=^0, из (11.19) имеем

(xt — т) = 0, откуда находим оценку

х для параметра т:

 

 

i-l

 

 

 

 

 

11

 

 

 

 

 

-

 

 

 

 

 

1

 

 

 

 

 

* =

---

 

 

 

 

 

 

П §

*1-

 

 

Дифференцируя функцию правдоподобия по а 2, получим

 

0L

п

1 .

1

Д * ,- т )’ =

0,

( 11. 20)

да2

2

о*

22)2

 

 

 

 

 

 

 

= 0.

 

 

Так как 1/(2 а2) ^ ,

имеем

п

 

 

 

 

 

 

 

 

 

 

" - “ Г

< * -« )• = о,

 

 

i=l

откуда находим оценку

2 U - * ) 2

( 11. 21)

3. Оценка математического ожидания и дисперсии. Метод максималь­ ного правдоподобия всегда приводит к состоятельным, хотя иногда и смещенным оценкам, имеющим наименьшую возможную дисперсию при неограниченном возрастании объема выборки. Для нормально распределенной случайной величины получают оценки следующего вида: среднее арифметическое Зс для математического ожидания тх

* = 2 х'!п

t=\

и выборочную дисперсию ^ для дисперсии D[X]

*’ = £(■X i - x f l n .

1=1

Последняя оценка получается несколько смещенной:

Для получения несмещенной оценки ^ надо умножить на п/(п—)\

 

п

п

(И.23)

S2

п — 1

2 (xt — л:)2/(/г — 1).

 

t=l

 

Уменьшение знаменателя в (11.23) на единицу непосредственно свя­ зано с тем, что величина Зс, относительно которой берутся отклонения, сама зависит от элементов выборки. Каждая величина, зависящая от элементов выборки и входящая в формулу выборочной дисперсии, называется связью. Можно доказать, что знаменатель выборочной дисперсии всегда равен разности между объемом выборки п и числом связей /, наложенных на эту выборку. Заразность

f = n - l

(П.24)

называется числом степеней свободы выборки. В практических вычисле­ ниях для дисперсии ^ часто удобна формула

 

 

 

 

 

п

 

 

(11.25)

легко вытекающая из (11.23):

 

 

 

 

 

 

 

 

 

 

s

U - *)2

 

 

 

 

S2=

-

^

------------ :

 

2xix +

*2)

 

 

 

 

п 1

 

 

 

 

=

п ^_ t

[( А — 2*!*+ я2) + (.*! — 2*2 * +

X2) Н-------h

+

(

— 2х„х + х2)] = n _ (

[( xf + 4

+

-----f

xj) —

 

(хх + х2 ч------- \- х„) +

(х2 + X2 +

• • •

+ ха)] =

__ 1_

п 1

Преимущество формулы (11.25) в том, что в ней нет операций вычита­ ния близких чисел, как в формуле (11.23), что приводит к потере точ­ ности. В формуле (11.25) эта операция применяется только один раз. Среднее и дисперсию выборки по сгруппированным данным табл. 1 вычисляют по формулам

k k

1=1

i= 1

п

k

* - * Y Р* 12

п — 1

Величина fc/\2 называется поправкой Шеппарда, она связана со смеще­ нием дисперсии при группировании.

4. Классификация ошибок измерения. Каждый результат измерения — случайная величина. Отклонение реального результата от истинного называется ошибкой наблюдения. Ошибка наблюдения также есть слу­ чайная величина —она является результатом действия только случайных (неучитываемых) факторов. Если обозначить истинный результат через я, ошибку —через АЛ", результат измерения —через Л", то

X —а = АХ.

(11.28)

Различают ошибки трех видов.

1. Грубые ошибки возникают вследствие нарушения основных усло­ вий измерения. Результат, содержащий грубую ошибку, резко отличает­ ся по величине от остальных измерений. На этом основаны некоторые критерии исключения грубых ошибок.

2.Систематические ошибки постоянны во всей серии измерений или изменяются по определенному закону. Выявление их требует спе­ циальных исследований, но как только систематические ошибки обна­ ружены, они могут быть легко устранены введением соответствующих поправок в результаты измерения.

3.Случайные ошибки ошибки измерения, остающиеся после устране­ ния всех выявленных грубых и систематических ошибок. При таком определении к случайным факторам, порождающим случайную ошибку, не относят факторы с постоянным действием (систематические ошиб­ ки) и факторы с однократным, но очень сильным действием (грубые ошибки). Случайные ошибки вызываются большим количеством таких факторов, эффекты действия которых столь незначительны, что их нельзя выделить в отдельности (при данном уровне техники измерения). При этом распределение случайных ошибок симметрично относительно нуля: ошибки, противоположные по знаку, но равные по абсолютной величине, встречаются одинаково часто. Из симметрии распределения ошибок сле­ дует, что истинный результат наблюдения есть математическое ожидание соответствующей случайной величины. Так как из (11.28) Х = а+ А Х и при отсутствии грубых и систематических ошибок

М [ДХ] = 0,

(11.29)

то

 

М[Х] = а.

(11.30)

В дальнейшем будут рассматриваться только случайные ошибки измере­ ний.

5. Закон сложения ошибок. Для независимых случайных величин свойством аддитивности обладают дисперсии, а не среднеквадратичные ошибки. Если Хи Х2, Хп независимые случайные величины; аь аъ ..., ап—неслучайные величины и

Z —а1Х1 + а2Х2+ • • • + а>пХ-п.

(11.31)

35

то выборочная дисперсия величины Z определится следующим образом:

 

 

s2 _

2„2

 

--- + < 8

(11.32)

 

 

sz — а\ sxt + 4 4 , +

Если положить яt = а2 = .. .=а„ = 1/п, то

 

 

 

 

 

 

7 _

Хг+

Xt + • • •

+Xn

 

v

 

 

 

Z =

 

n

■— Л.

 

В этом случае

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

s% +

s*. ^--------ь 4 n

=

2 L

(11.33)

 

 

sx

 

n2

 

 

 

 

 

 

 

n

 

,

2 4

,

 

 

 

 

 

 

-2

t=i

1

 

 

 

 

 

 

где

Если величины Xv Х2, ..., Хп интерпретировать как п независимых на­

блюдений одной и той же случайной величины Z, то 3* =:

**•

*$*

Тогда получим

 

 

(11.34)

4

= Ь2у/я.

 

х

Л

 

 

Из выражения (11.34) следует практический вывод: при оценке точности двух методов следует учитывать длительность анализа. Применяя менее

точный экспресс-метод, можно сделать за то же время значительно большее число опытов и добиться более высокой точности, чем дает трудоемкий точный метод.

6. Ошибки косвенных измерений. Измерения делят на прямые и

.косвенные. В первом случае непосредственно измеряется определяемая величина, при косвенных измерениях она задается некоторой функцией от непосредственно измеряемых величин. Пусть случайная величина z зависит от наблюдений хи ..., хп по известному закону:

* = *2, ... , хп).

Истинное значение величины z может не совпадать с математическим ожиданием Мг, а определяться тем же законом:

г= /(л

т

тО

 

Величина а2 называется средним косвенного измерения.

Дисперсия косвенного измерения

а | определяется так же, как

обычная дисперсия, только отклонения берутся от среднего косвенного измерения az. Ее можно найти, зная дисперсии отдельных наблюдений и вид функции / На практике определяют выборочные дисперсии да. и по ним выборочную дисперсию косвенного измерения &z , которая служит оценкой генеральной дисперсии Чтобы найти $ , разложим функцию z=f(xv х2> хп) в ряд Тейлора в точке (mX)i mx<i9 ограничиваясь членами первого порядка

df

.......’ т*п) + 1 £ 1 Х1- п Л +

df

df

:-S №

Выражение (11.36) называют законом накопления ошибок.

Пример 1. Оценить ошибку определения линейной скорости движения газа в трубо­ проводе у, пользуясь следующими результатами измерений: количество газа G = 3000 мз/ч; ошибка-1СМ2измерения. sG —10 мз/ч; сечение трубопровода F —0,1 м2; ошибка измерения

SF

Р е ш е н и е . Рассматривая линейную скорость как результат косвенного измерения

G3000

v= — = - = 30000 м/ч = 8,82 м/с,

определим по формуле (11.36):

-1 /

G2

=

F4

 

 

 

 

V 1• 10~а - 102 + 9 • 10* • 10-8 = 0,03 м/с.

 

 

1 . 10-2 • 3600

 

7. Определение дисперсии по текущим измерениям. Математическое ожидание (среднее) и дисперсия генеральной совокупности оцениваются средним и дисперсией выборки тем точнее, чем больше объем выборки. При этом среднее характеризует результат измерений, а дисперсия — точность этого результата (дисперсия воспроизводимости) (см. гл. II, §4). Если проделано т параллельных опытов (опытов, проведенных при неизменном комплексе основных факторов) и получена выборка yv у2, ..., ут значений измеряемой величины, то дисперсия воспроизводи­ мости равна

т т

 

2 у)г

2

у»

s*

= - “=!--------------- , гдеу=

воспр

m — 1

*

т

и ошибка опыта (ошибка воспроизводимости)

 

 

SBOCnp—Y

SBOCnp*

 

Часто для оценки точности применяемой методики ставят специаль ную серию опытов, многократно повторяя анализ одной и той же прооы. На проведение большой серии опытов требуется много времени, в течение которого может неконтролируемым образом измениться сред­ нее значение результатов анализа. Значительно проще и удобнее опреде­ лять ошибку воспроизводимости по текущим измерениям.

Предположим, анализируются п проб. При анализе каждой про ы

делается различное число параллельных опытов: mv т2,

Мп- Вычис­

лим частные дисперсии & , д2 , ...,

для каждой такой выборки в от­

дельности. Число степеней свободы частных дисперсий соответственно

равно: f } =т] - 1, f 2 = m2- 1, f n=mn - 1. Общая дисперсия воспроиз­ водимости всех опытов будет равна средневзвешенному значению част­ ных дисперсий (в качестве весов берутся степени свободы):

 

а

/l5?"Ь /2S2"Ь ***"Ъ /nsn

 

 

SflOCnP ~~

/1 + /»+■•• + /n

 

=

(mj— l)s?+(m2—l)s? Ч-------

H(mn —Os^

»

---------------

7----■ ' , ----------------------(П-37)

 

 

m1 + m2-\- • • • +

mn — л

 

Число степеней свободы общей дисперсии равно общему числу изме­ рений минус число связей, использованных для определения п средних:

п

mi —Пт

(11.38)

/воспр = т\ + т 2 + ***+ тп п = 2

t =

l

 

Учитывая, что частные дисперсии определяются по результатам парал­ лельных опытов по формуле

 

2

(уы — yi)2

 

 

 

 

2 и= 1

 

 

, i= 1, 2, . . . , л,

 

St

mi

1

из (11.37) имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

(mt — I) + (m21) S2Ч-------h (mn 1) s°

S BOCnp

 

« 1 4- m24-------hffln- я

 

 

 

 

 

 

 

 

2

 

— </Л2

2

(m«~ 1)4

2

(mf — 1) “=1

m* — 1

i=i________

1=1

n

 

П

 

 

 

 

 

2

m,- я

 

 

2

m«” n

 

i=i

 

m,

t =

l

 

 

 

 

n

 

 

 

 

 

 

2

2

у*)2

 

 

 

 

 

u = 1

 

 

(11.39)

 

 

 

Я

f

 

 

 

 

 

 

 

 

 

 

 

2

mt — n

 

 

 

 

 

 

1=1

 

 

 

 

Если число параллельных опытов при анализе каждой пробы одина­

ково т}=т2 = ... = тп =т, формулы для

расчета дисперсии воспроиз­

водимости упрощаются. При этом

 

 

 

 

2

S BOCnp

( m - l) ( s ? 4-sf+ - -- + s 2)

(m~ 0 S

*

(11.40)

mn n

n(m— 1)

n

 

Таким образом, при равном числе параллельных опытов общая дисперсия воспроизводимости равна среднеарифметическому значению частных дисперсий. Число степеней свободы общей дисперсии при

этом равно

И окончательно

лт

а

2

2 (yiu—y if

 

_

 

(11.42)

S B o cn p

 

п ( т — 1)

 

 

 

Число степеней свободы у общей дисперсии воспроизводимости, определяемой по формулам (11.39) и (11.42), гораздо больше, чем у каждой частной дисперсии в отдельности. Поэтому общая дисперсия воспроиз­ водимости намного точнее оценивает дисперсию генеральной совокуп­ ности ав2оспр.

При вычислении дисперсии воспроизводимости по текущим измере­ ниям объединяют между собой только те пробы, которые можно рас­ сматривать как выборки из генеральных совокупностей с равными

дисперсиями. При этом каждое из значений ^

^ , ...,

можно рас­

сматривать как оценку одной и той же генеральной дисперсии.

 

Пример 2. Результаты определения

концентрации (%) Р2О5 в системе (NH^HPCU -

- К2СО3 - Н2О колориметрическим методом приведены в таблице.

 

 

Определить ошибку колориметрического метода по текущим измерениям.

 

Н омер

 

 

 

Н ом ер

пробы

 

 

 

опыта

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

1

2 7,9

19,3

4 ,5

22,3

10,8

16,3

8,8 ‘

12,6

2

2 7 ,2

19,7

5 ,2

23,5

8 ,9

1 5 ,8

8 ,7

13,5

3

26,8

4 ,8

21,7

17,2

9 ,2

13,3

Ъ уи

8 1 ,9

3 9 ,0

14,5

6 7 ,5

19,7

4 9 ,3

2 6,7

3 9 ,4

Z y j

2 2 3 6 ,4 9

7 6 0 ,5 8

7 0 ,6 9

1 5 2 0 ,4 3

1 9 5,85

8 1 1,17

2 3 7 ,7 7

5 1 7 ,9 0

m i

3

2

3

3

2

3

3

3

Р е ш е н и е . По данным таблицы вычислим sf по формуле

а

 

1

 

2 Уа

 

2 \ и=1

s i

=

mi— 1

ya­

rn J

 

 

 

Для вычисления общей дисперсии по формуле (11.37) понадобятся слагаемые вида

mt

2 уи

а \и= 1

si (пц 1) = Уи—----—

пц

и = \

(mi — 1)s* = 2236,49 — ———

= 0,62.

 

О

 

Аналогично

 

 

(m21) = 0,08;

3 1) s§ = 0,61;

41) s* = 1,68;

(т8- l)s|= 1,805;

(тв — 1) sg = 1,01;

(яц - 1) s?= 0,14;

(та — 1) sg = 0,045.

Число степеней свободы общей дисперсии воспроизводимости равно

8 8

 

/в осир —

2

/* =

2

mi — 8 = 22 — 8 =

14.

 

 

t=l

 

i=i

 

 

 

И дисперсия воспроизводимости

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s2

_

2 sih

5,99

 

 

 

1=1

 

= 0,4279.

 

 

воспр

 

/воспр

14

 

 

 

 

 

Ошибка колориметрического метода, определенная по текущим измерениям, равна

 

sBocnp =

У * * * „ „

=

/ М

279 = 0 ,6 5 4 .

 

8.

Доверительные интервалы и доверительная вероятность. Выбороч­

ные параметры являются случайными величинами, их отклонения от

генеральных (погрешности)

также

 

будут

случайными.

Оценка этих

отклонений носит вероятностный характер —можно лишь указать вероят­ ность той или иной погрешности. Для этого в математической статистике пользуются доверительными интервалами и доверительными вероят­ ностями.

Пусть для генерального параметра а получена из опыта несмещен­ ная оценка а*. Нужно оценить возможную при этом ошибку. Назначим достаточно большую вероятность Р —такую, что событие с вероят­

ностью

Р можно считать практически достоверным,

и найдем такое

значение

е =Д Р ) = ер , для которого

 

 

Р ( Iа*а | < ер) =р.

(11.43)

При этом диапазон практически возможных значений ошибки, возни­ кающей при замене а на д*, будет ± гр, большие по абсолютной величине ошибки будут появляться только с малой вероятностью

P = 1 - Р .

( I I . 44)

называемой уровнем значимости. Уровень значимости часто выражают в процентах. Иначе выражение (11.43) может быть интерпретировано как вероятность того, что истинное значение параметра а лежит в пре­ делах