Оптимизация эксперимента в химии и химической технологии
..pdfСумма вероятностей всех возможных значений случайной вели чины равна единице
2 А* = 1, |
(1-Ю) |
/=1 |
|
так как тот факту что случайная величина примет в результате опыта одно из своих значений, есть достоверное событие. Эта сум марная вероятность распределена определенным образом между отдельными значениями.
Дискретную случайную величину можно полностью задать ве- роятностным рядом, указав вероятность pi для каждого значения
Xj |
\ Xl |
\ х2 \ |
х г |
\ . . . |
\ |
х п |
Pi |
I Pi |
I. Р2 I |
Рг |
I |
I |
Pn |
Всякое соотношение, устанавливающее связь между возможны ми значениями случайной величины и соответствующими им вероят ностями, называется законом распределения. Вероятностный ряд является одним из видов законов распределения случайной вели чины.
Распределение непрерывной случайной величины нельзя зада вать при помощи'вероятностей отдельных значений. Число значе ний так велико, что для большинства из них вероятность принять эти значения равна нулю, т. е. событие может произойти, а вероят ность его равна нулю. Для непрерывных случайных величин изуча^- ется вероятность того, что в результате опыта значение случайной величины попадет в некоторую заранее намеченную совокупность чисел. Удобно пользоваться вероятностью события Х < х, где х — произвольное действительное число, а X — случайная величина. Эта вероятность является функцией от х
P ( X < x ) = F(x) |
(1.11) |
иназывается функцией распределения случайной величины.
Ввиде функции распределения можно задать распределение как непрерывной, так и дискретной случайной величины. Как видно из определения, F(x) есть неубывающая функция х, если х ^ х 2, то
F(X]) ^ F ( X2) (рис. 4, а). Ордината этой кривой, соответствующая точке Xi, представляет собой вероятность того, что случайная вели чина X при испытании окажется <х\. Разность двух ординат, соот ветствующая точкам Xi и х2, дает вероятность того, что значения случайной величины будут лежать в интервале между xi и х2:
Р(хЛ < X < дг2) = F( x 2) — F (хi). |
(1-12) |
Значения функции распределения при предельных значениях аргу мента соответственно равны 0 и 1:
F( — oo)^= 0, F ( + оо)=1. |
(1.13) |
Функция распределения дискретной случайной величины всег да есть разрывная ступенчатая функция, скачки которой происхо-
дят в точках, соответствующих возможным значениям случайной величины, и равны вероятностям этих значений (рис. 4, б). Сумма
всех скачков равна 1.
Для непрерывной случайной величины наиболее часто употреб ляется производная функции распределения — плотность распреде
ления случайной величины X. Если F(x) |
непрерывна и дифферен |
цируема, то |
|
f ( x ) = F '(x j . |
(1.14) |
Рис. 4. Функция распределения непрерывной случайной величины (а) и дискретной случайной величины (б)
Задание f(x) тоже полностью определяет случайную величину. Плотность распределения является неотрицательной функцией (рис. 5). Площадь, ограниченная осью х, прямыми X=Xi и х= х2 и кривой плотности распределения, равна вероятности того, что слу чайная величина примет значения
из интервала Х\-^-х2:
|
Р (*! < X < х2) = |
|
|
х, |
|
Рис. 5. Плотность распределения |
= j f { x ) d x ^ F ( x 2) - F ( x { ) , |
(1.15) |
непрерывной случайной величины |
*1 |
|
|
в частности |
|
|
х |
|
F(x) = P ( — оо < |
X < х ) = | / (х) dx. |
(1.16) |
|
-- ОО |
|
Отсюда же выводится еще одно важное свойство плотности распре деления
j* f ( x ) d x ^ l , |
(1.17) |
--00 |
|
так как попадание случайной величины в интервал —оо<Х< + оо есть достоверное событие.
2. Числовые характеристики. Вместо полного определения слу чайной величины в виде законов распределения вероятностей в при-
12
кладных задачах ее часто определяют при помощи числовых харак теристик— чисел (вещественных), выражающих характерные осо бенности случайной величины, называемых моментами случайной величины. Для дискретной случайной величины начальный момент krvo порядка определяется формулой
л*а = 2 дг?Л А = 1 , 2 ......... |
(1.18) |
i - i
для непрерывной случайной величины
оо |
|
т * = | x kf ( x ) d x . |
(1.19) |
— оо |
|
Начальный момент первого порядка (&=1) называется математи ческим ожиданием (средним значением) случайной величины. Ма тематическое ожидание принято обозначать различным образом:
М [Z], шх, т.
Для дискретных случайных величин
1Я1 = Л![Л] = 2 ! xiPi- |
(1-20) |
i - i
Для непрерывных случайных величин математическое ожидание выражается интегралом:
оо
тх = М[Х] = j x f ( x ) d x . |
(1.21) |
Чаще, чем начальные моменты, применяются центральные мо менты. Центральный момент k-ro порядка для дискретной случай ной величины определяется формулой
н* = i2-i (■ — mxfPi> |
(1 •22) |
для непрерывной случайной величины |
|
ОО |
|
= J (X — mx)kf (х) d x . |
(1.23) |
— оо |
|
Первый центральный момент всегда равен 0, щ = 0. Второй цент ральный момент называется дисперсией. Дисперсией случайной ве личины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания, т. е.
D[X] = M [ ( X - m x)2]. |
(1.24) |
Для дискретной случайной величины
0 Iх ] = V-2= 2 с*/ — mx)2Pi, |
(1.25) |
х-1
для непрерывной
D lx ] = J (* — mx)2f ( x ) d x . |
(1.26) |
Другие обозначения для дисперсии Dx, ох2, а2. Корень квадрат ный из второго центрального момента называется средним квад ратичным отклонением (или станда:ртом):
°x = V D[X] = y~^ . |
(1.27) |
Третий центральный момент, разделенный на а*3, называется коэф фициентом асимметрии:
Yi = f*3/o3. |
(1*28) |
Через начальные моменты ц3 выражается следующим образом:
|х3 = /тг3 — Ътп\гп2 + 2т\. |
(1.29) |
Четвертый центральный момент вычисляется по формуле
(j-4 = rri4— 4mim3 -Ь 6m^/7Z2— 3т\. |
(1.30) |
Величина |
|
Y 2 = ( N / * 1 ) - 3 . |
(1.31) |
называется коэффициентом эксцесса.
На рис. 6 приведены примеры плотностей распределений с не нулевыми коэффициентами асимметрии и эксцесса. Для сравнения штриховой линией изображена кривая с теми же математическим ожиданием тх и дисперсией ох2у но с нулевыми значениями коэф
фициентов эксцесса и асимметрии. |
|
|
Моменты существуют, если |
соответствующие интегралы или |
|
ряды для дискретных величин |
сходятся. Для случайных |
величин, |
значения которых ограничены, |
моменты всегда существуют. Если |
|
у случайной величины X существуют первый и второй моменты, то |
||
можно построить нормированную случайную величину: |
|
|
Х 0 = ( Х - т хУ*х . |
(1.32) |
|
Для нормированной случайной величины |
|
|
М [ Х <>] = |
0, D [ X о] = X. |
(1.33) |
Многие таблицы распределений построены именно для норми рованных случайных величин. Существуют следующие соотноше ния между функциями распределения, соответствующими нормиро ванной величине Х0 и ненормированной X:
/ ( ■ * ) = — |
/ i (*о) = — |
/1 ( |
— |
(1. 34) |
ах |
ах |
\ |
ах |
/ |
/1 С*о) = axf (•*) = Qxf («v + Од-лго), |
(1.35) |
F (x) = Л (лго) = Л (■* ^ ) , |
(1.36) |
Л(*о) = ^ (*) = ^('и«: + а.д:*о). |
(1,37) |
Моменты являются общими (интегральными) характеристиками распределения. Вторая группа параметров характеризует отдель ные значения функции распределения. К ним относятся квантили. Квантилем хр распределения случайной величины X с функцией распределения F(x) называется решение уравнения
F ( x p) = p, |
(1.38) |
т. е. хР есть такое значение случайной величины, что
р (X < Хр) = р. |
(1.39) |
Если известны два квантиля хР и хд, то
Р ( х р < X < x q) = q — р. |
(1.40) |
Наиболее важное значение имеет квантиль x0i5, называемый ме дианой распределения (рис. 7). Ордината медианы рассекает пло-
Рис. |
6. Плотность распределений с ненуле- |
Рис. 7. Медиана распределен |
выми |
коэффициентами асимметрии и экс- |
ния |
|
цесса |
|
щадь между кривой плотности вероятности и осью абсцисс пополам. Если распределение симметрично,
*0,5 = тх . |
(1 .4 1 ) |
Квантили хр и Х\-р называются симметричными. Для симметрич ного относительно нуля распределения всегда
* р = — * 1 —р» |
(1 .4 2 ) |
Наиболее часто в приложениях математической статистики ис пользуют математическое ожидание — характеристику положения значений случайной величины на числовой оси и дисперсию (или
среднее |
квадратичное отклонение), определяющую характер раз |
||
броса значений случайной величины. |
|
Примем |
|
3. |
Свойства математического ожидания и дисперсии. |
||
без доказательства следующие свойства математического ожида |
|||
ния и дисперсии случайных величин: |
|
|
|
1. |
Математическое ожидание неслучайной величины равно зна |
||
чению этой величины: |
|
|
|
|
М[с] = с. |
|
(1.43) |
2. Неслучайную величину можно выносить за знак математиче |
|||
ского ожидания: |
|
|
|
|
М[сХ] = сМ[Х]. |
(1.44) |
|
3. Математическое ожидание суммы случайных величин равно |
|||
сумме математических ожиданий этих случайных величин: |
|
||
|
М [Xi + * 2 + ... + Хп] = М [*j] + |
М [Х2] + . . . + М [Х„]. |
(Г 45) |
4. Математическое ожидание произведения независимых слу |
|||
чайных величин равно произведению |
математических ожиданий |
||
сомножителей: |
|
|
|
|
М [XVX2-. . . . Хп] = м № ] М [Х2] . . . . -М [*„]. |
(1.46) |
Случайные величины называются независимыми, если каждая из них имеет самостоятельное распределение, не зависящее от воз можных значений других величин.
Свойства дисперсии:
1. Дисперсия неслучайной величины равна нулю:
£>[с] = 0. |
(1.47) |
2. Неслучайную величину можно выносить за знак дисперсии, возведя ее в квадрат:
D\cX] = cW[X\. |
(1.48) |
3. Дисперсия случайной величины равна математическому ожи данию квадрата случайной величины минус квадрат ее математиче ского ожидания:
D[X\ = М[Х2) — т2. |
(1.49) |
4. Дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин:
D[Xl + X2+ . . . + X n\ ^ D [ X l) + D[X2} + . . . + D [ X n]. (1.50)
Используя свойства математического ожидания и дисперсии, покажем, что для нормированной случайной величины справедли во утверждение (1.33) , т. е. если4
Х — тх
то
A f[* b ]-0 , [А-d = 1,
M [ * 0] = М { х. ~ |
т* \ = |
— . М ( Х — тх) = |
— [Af (X ) — тх] = О, |
||
\ |
ах |
/ |
«г |
ах |
|
D ( А'0) = D ( X ~ |
m x ) = |
- j D ( X - m x) = - \ - |
l D ( X ) - 0 ] = - ^ р ~ = 1. |
||
' |
х |
' |
ах |
°Х |
°JC |
Пример 2. В результате испытаний двух расходомеров установлена вероят ность наблюдения помех, оцениваемых по двухбалльной системе:
Уровень помех, балл |
Вероятность.наблюдения помех данного уровня |
||
расходомер 1 |
1 |
расходомер 2 |
|
|
|| |
||
1 |
0,20 |
|
0,03 |
2 |
0,065 |
|
0,15 |
По приведенным данным выбрать расходомер, который в среднем имеет меньший уровень помех и более устойчивые показания.
Р е ш е н и е . Обозначим через X |
случайный |
уровень помех расходомера. |
|
Определим средний уровень помех для |
каждого расходомера по формуле (1.20): |
||
Мг [ЛГ] = |
0,20-1 |
+ 0,065-2 = 0,33, |
|
М2 [X] = |
0,03-1 + 0 , 1 5 - 2 = |
0,33. |
Таким образом, средний уровень помех у обоих расходомеров одинаков и по этому показателю нельзя выбрать лучший прибор. Определим устойчивость пока заний, для этого по формуле (1.25) посчитаем дисперсии уровня помех для каж дого расходомера
Di [X] = (1 — 0,33)2.0,2 + (2 -0 ,3 3 )2 -0 ,0 6 5 = 0,11.
Z)2 [AT] = (1.— 0,33)2.0,03 -ь (2 — 0,33)2-0,15.= 0,43.
Следовательно, лучшим является первый расходомер.
4. Равномерное распределение. Определим основные числовые характеристики одного из простейших непрерывных распределе ний— равномерного распределения. Равномерным распределением называется распределение, для которого плотность вероятности по стоянна в определенных пределах и равна нулю вне этих пределов (рис. 8). Плотность f(x) постоянна и равна с на отрезке {а, Ь)\ вне этого отрезка она равна нулю:
гс при а < х < Ь,
^~~ \0 при х < а или х > Ь.
Так как площадь, ограниченная кривой распределения, равна еди нице:
с (6 — а) = 1, то с = 1 /(Ь — а),
и плотность распределения f{x) имеет вид
/ (JC) = — -— |
при а < х |
< bt |
|
Ъ— а |
|
|
|
/ (*) = 0 |
при х < а |
или.х < Ъ. |
(1.51) |
В |
■"Л |
|
17 |
Функция распределения выражается площадью кривой распре деления, лежащей левее точки х. Следовательно,
Опри х < а ,
х— а
F(x) = —------- |
при а < х < Ьь |
(1.52) |
о — а |
|
|
1 |
при х > Ъ. |
|
График функции F(x) приведен на рис. 9. Математическое ожида ние случайной величины X, имеющей равномерное распределение на участке (а, Ь), равно
тх |
CL -f" Ь |
(1.53) |
|
|
2 |
В силу симметричности равномерного распределения медиана вели чины X также равна (а+Ь)/2.
f(x) |
|
|
C -J-. |
1 |
1 |
с 6-а |
||
|
1 |
1 |
|
1 |
1 |
|
1 |
1 |
|
1 |
1 |
0 |
__ 1 |
1___ |
а |
Ь х |
Рис. 8. |
Плотность |
вероятности |
|
|
Рис. 9. График функции F(x) |
|
равномерного распределения |
|
|
равномерного распределения |
|||
По формуле (1.26) определим дисперсию случайной величины X: |
||||||
|
|
|
‘ |
|
|
(1 . 8 4 ) |
|
|
|
а |
|
|
12 |
|
|
|
|
|
|
|
Коэффициент асимметрии |
|
|
|
|||
|
|
|
Yi = Ы°х |
|
|
|
равен нулю (распределение симметрично), |
||||||
Для |
определения |
коэффициента |
эксцесса найдем четвертый |
|||
центральный момент: |
|
|
|
|
||
|
w - 7 |
1 |
С ( |
а + Ь \ * . |
( b - a ) i |
|
|
3 |
7 ) (•*— |
— |
|
|
|
отсюда |
|
|
|
|
|
|
|
|
|
У2=± г - 3 = |
-1 ,2 . |
ах
Вероятность попадания равномерно распределенной случайной величины X на участок (а, р), представляющий собой часть участ ка (а, Ь) (рис. 10), определяется отношением длины отрезка (а, р) к длине всего участка (а, Ь):
В— а
Р (а < $ ) = ---_-■ а . (1.55)
5. Нормальное распределение. Случайная величина X называ ется распределенной по нормальному закону, если ее плотность распределения имеет вид
( х - т х у
1
/ ( * ) = — = б * — o o < * < o o f (Г. 56) V 2Я0г
где тх и ах2— математическое ожидание |
и дисперсия |
случайной |
||
величины X. |
|
|
|
|
Функция распределения |
|
|
|
|
|
х |
( х - т ) * |
|
|
1 |
---------Т— |
|
||
Г |
2о2 |
(1.57) |
||
F{x) = — zzi— |
\ |
е |
х dx. |
|
V2лсх |
|
|
|
|
Нормальное распределение наиболее часто встречается на практи ке и теоретически наиболее полно разработано. Нормальный закон
при |
некоторых |
условиях |
является |
|
|
|
|
|
|
||||
предельным |
законом |
для |
суммы |
fix) |
|
|
|
|
|
||||
большого числа п независимых слу |
|
|
ИР |
|
|
||||||||
чайных величин, каждая из которых |
|
I |
1 |
|
|||||||||
подчинена |
какому |
угодно |
закону |
- |
1 |
I |
|
||||||
распределения |
(теорема Ляпунова). |
1 |
[ |
|
|||||||||
Основное ограничение состоит в том, |
- |
1 |
И |
|
|
||||||||
1 |
1 |
X |
|||||||||||
чтобы все слагаемые играли в общей |
0 |
а |
с^ |
Jв |
|||||||||
сумме |
относительно |
малую |
роль. |
|
|
|
|
|
|
||||
Множество событий происходит слу |
Рис. |
10. Определение вероятно |
|||||||||||
чайно |
вследствие воздействия на |
сти |
попадания |
равномерно |
|||||||||
них |
большого |
числа |
независимых |
распределенной |
случайной |
ве |
|||||||
(или |
|
слабо |
зависимых) |
возмуще |
личины на заданный участок |
||||||||
ний. |
У таких явлений закон распре |
|
|
|
|
|
|
деления близок к нормальному. Нормальный закон распределения широко используется при обработке наблюдений. Пользуясь мето дами теории информации, можно показать, что нормальное распре деление содержит минимум информации по сравнению с любыми распределениями с той же дисперсией. Следовательно, ’замена не которого распределения эквивалентным нормальным не может привести к переоценке точности наблюдений. График плотности нормального распределения называется нормальной кривой или
кривой Гаусса (рис. 11).
Нормальное распределение нормированной случайной величины называется стандартным. Его функция распределения имеет вид
X |
хч |
|
Л) ( • * ) = —7 = r f |
e ~ ~ d x . |
(1.58) |
График этой функции представлен на рис. 12. Для такой величины
Р (*! < * o < х2) = F0 (Х2) - Р 0(Х1). |
(1.59) |
Функция |
|
Ф(*) = Л) (•*) — -£“ |
(1.60) |
Рис. 12. График функции F0(x) стандартного нормального распре деления
называется функцией Лапласа;
X |
|
.Ф(х) = Р0(х) — Р0(0) = —— Г в |
(1.61) |
Таблицы значений этой функции приводятся в табл. 1 приложения. Функция Лапласа — нечетная функция, т.*е.
Ф( — х ) = — Ф(х), |
ft. 62) |
поэтому таблицы значений Ф(*) |
составлены лишь для *>0. |
||||||
Для нормированной случайной |
величины, учитывая |
(1.59) и |
|||||
(1.60), имеем |
|
|
|
|
|
|
|
P (* i < Х0 < х 2) = ф (х2) + I/2 - |
ф (* I) — 1/2 = |
Ф (*2) - |
Ф(*!)• |
(1.63) |
|||
В общем случае |
|
|
|
|
|
|
|
P(Xl< x < x 2) = P ( ^ ~ mx <X0 < ^ |
- |
mA |
^ |
|
|||
|
\ |
ах |
|
ах |
1 |
|
|
*2— тх |
|
Х\ — тх |
)• |
|
|
|
|
= ф ( |
°х |
|
°х |
|
|
(1.64) |