
книги / Моделирование химико-технологических процессов
..pdfМатематическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий,
Щ Х уХ 2 • = Щ Хх\ ЩХ2\ М[Хп]. (5.22)
Случайные величины называются независимыми, если каждая из них имеет самостоятельное распределение, не зависящее от возможных значений других величин.
Дисперсия неслучайной величины равна нулю |
|
D[c] = 0. |
(5.23) |
Неслучайную величину можно вынести за знак дисперсии, |
|
D[cX] = cD[Xl. |
(5.24) |
Дисперсия случайной величины равна математическому ожиданию квадрата случайной величины минус квадрат ее математического ожида ния,
D[X] = M [X*]-mx2. |
(5.25) |
Дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин,
D{X\+X2 + ...+ * „ ] = D[X\] + D[X2] + ...+ D[Xn]. |
(5.26) |
5.2.Равномерное распределение
Равномерным называется распределение, для которого плотность вероятности fix) постоянна в определенных пределах и равна нулю вне этих пределов (рис. 5.4),
с |
при а< х < Ъ |
/ (* ) = 0 при |
(5.27) |
х < а или х>Ь |
Другими словами равномерным называется распределение такой случайной величины, появление любого значения которой равновероятно.
Так как площадь, ограниченная кривой распределения, равна едини це c{b - а) = 1, то в формуле (5.27) с = 1 !{Ъ - а).
Функция распределения (рис. 5.5) задается выражением:
0 |
при |
х < а |
|
х - а |
при |
а < х < Ь |
(5.28) |
F(x) = |
Ъ -а
1 при х > Ъ
Рис. 5.4. Плотность вероятности |
Рис. 5.5. Функция равномерного |
равномерного распределения |
распределения |
Математическое ожидание равномерно распределенной случайной величины X определяется как
тX |
(5.29) |
В силу симметричности равномерного распределения медиана вели чины X также определяется как *о,5 = (я + Ь)/2. Дисперсия случайной вели чины X
стх2 |
(5.30) |
5.3.Нормальное распределение
Случайная величина X называется распределенной по нормальному закону, если ее плотность распределения имеет вид
1 / (* ) = - Ж
где -о о < х < оо.
Функция распределения
( х ~ т х )
2oi
(5.31)
|
( х ~ т х ) |
|
|
F (x ) = - |
2ст? |
dx. |
(5.32) |
гл/2л |
Iе |
|
|
Плотность и функция распределения нормированной случайной ве личины соответственно определяются как
1 |
- V |
(5.33) |
/о(*) = |
|
|
л/2Г |
|
|
Fo(x)= w |
J : 2dx- |
(5.34) |
|
Нормальное распределение нормированной случайной величины на зывается стандартным.
Графики плотности и функции нормального распределения норми рованной случайной величины приведены на рис. .5.6, а, б.
Нормальное распределение наиболее часто встречается на практике и теоретически наиболее полно разработано. Нормальный закон при неко торых условиях является предельным законом для суммы большого числа п независимых случайных величин, каждая из которых подчинена какомулибо закону распределения. Основное ограничение состоит в том, чтобы все слагаемые играли в общей сумме относительно малую роль. Если у яв лений множество событий происходит случайно вследствие воздействия на них большого числа независимых (или слабо зависимых) факторов, то закон распределения таких явлений близок к нормальному. Нормальный закон распределения широко используется при обработке наблюдений.
б
Рис. 5.6. Плотность (а ) и функция (б ) нормального распределения
Нормальное распределение содержит минимум информации по сравнению с любыми распределениями с той же дисперсией. Следова тельно, замена некоторого распределения эквивалентным нормальным не может привести к переоценке точности наблюдений. График плотности распределения называется нормальной кривой или кривой Гаусса.
Ф(х) = Fo(x) - 0,5 |
(5.35) |
называется функцией Лапласа,
(5.36)
Функция Лапласа - нечетная функция, т.е. Ф (-х) = -Ф (х), поэтому таблицы значений Ф(х) составлены только для х > 0.
5.4. Доверительные интервалы и доверительная вероятность,
распределение Стьюдента
На практике всегда располагают ограниченным числом значений случайной величины, представляющим собой некоторую выборку из гене ральной совокупности. Под генеральной совокупностью понимают все до пустимые значения случайной величины. Выборка является репрезента тивной (представительной), если она дает достаточное представление об особенностях генеральной совокупности. Если о генеральной совокупно сти ничего не известно, единственной гарантией репрезентативности явля ется случайный отбор. Выборочные параметры являются случайными ве личинами, их отклонения от генеральных также будут случайными. Оцен ка этих отклонений носит вероятностный характер, т.е. можно лишь ука зать вероятность той или иной погрешности. Для этого в математической статистике пользуются доверительными интервалами и доверительными вероятностями. Доверительная вероятность характеризует надежность по лученной оценки.
Пусть имеется выборка объема гг значений случайной величины. Наилучшей оценкой для тх является среднее выборки х :
п
(5.37)
п
Для выборок из генеральной совокупности, распределенной нор мально, можно показать, что х также имеет нормальное распределение со средним значением тх и средним квадратическим отклонением,
(5.38)
Тогда доверительный интервал для математического ожидания бу дет иметь вид
X |
< X + ~р= |
(5.39) |
|
vw |
|
где и р - квантиль стандартного нормального распределения.
]~2
Стандартное нормальное распределение симметрично относительно нуля, поэтому
И р = - « _ р . |
(5.40) |
21 2
Вслучае односторонней оценки математического ожидания, т.е. оценки только сверху или только снизу, квантили берутся для вероятности
ри 1 - р соответственно.
Значения квантилей нормального распределения приведены в при ложении 1. Определить доверительный интервал описанным выше спосо2- бом можно только в том случае, если известна генеральная дисперсия а х . Получить генеральную дисперсию из наблюдений нельзя, ее можно только оценить при помощи выборочной дисперсии sx . Ошибка от замены гене ральной дисперсии выборочной будет уменьшаться с увеличением объема выборки. На практике эту погрешность не учитывают при п > 50, и в фор муле (5.39) для доверительного интервала генеральный параметр заменяют выборочным стандартом.
При небольших объемах выборки для построения доверительного интервала используют распределение Стьюдента или /-распределение. Распределение Стьюдента имеет случайная величина /:
/ = |
X — 171Y г- |
(5.41) |
--------2-л/и . |
Плотность вероятности /-распределения имеет вид
|
/+! |
|
2 |
/ (0 = |
(5.42) |
где Г - гамма-функция; / - число степеней свободы выборки; -оо < / < оо. Если выборочная дисперсия s\ и среднее х определяются по одной и той же выборке, то/ = п - 1.
Таким образом, распределение Стьюдента зависит только от числа степеней свободы /, с которым была определена выборочная дисперсия. На рис. 5.7 приведены графики плотности /-распределения для числа сте пеней свободы:/ = 1, / = 5 и / = 50.
•f= 1 ------ |
f= 5 ------ |
f = 50 |
Рис. 5.7. Плотность распределения Стьюдента
Из рисунка видно, что при / = 50 распределение Стьюдента практи чески совпадает с нормальным распределением (рис. 5.6, а) и так же, как и нормальное, распределение Стьюдента является симметричным.
Доверительный интервал для математического ожидания /-распре деления равен
х - |
< mv |
(5.43) |
где р - квантиль распределения Стьюдента. Значения квантилей рас
пределения Стьюдента приведены в приложении 4.
5.5. Определение общей дисперсии для серии параллельных опытов
Математическое ожидание и генеральная дисперсия оцениваются выборочным средним и дисперсией выборки тем точнее, чем больше ее
объем. При этом среднее характеризует результат измерений, а дисперсия - точность этого результата.
Предположим, анализируются п различных проб. Если производить определение выборочной дисперсии для каждой пробы отдельно, то по требуется очень много времени. Чтобы сократить количество анализов и время на их выполнение, расчет дисперсии производят сразу по всем про бам. Пусть при анализе каждой пробы выполнено параллельное число
опытов: т\у mi, тп. Число степеней свободы частных дисперсий соот
ветственно определяется как: f\ = т\ - 1, /2 = m2 - 1, ... , f n - m n - 1. Об
щая дисперсия воспроизводимости всех опытов будет равна средневзве шенному значению частных дисперсий, где в качестве весов берутся сте пени свободы:
2 |
_ f l sl + f l s2 + —+ fnsn |
(5.44) |
||
sвое |
/1 |
+ / 2 + - |
+ /n |
|
|
|
|||
Учитывая, что число степеней общей дисперсии |
|
|||
Л о с= |
/ . + / 2 |
+ •■■+ /„ |
= 2 > / - И> |
(5.45) |
|
|
|
1=1 |
|
ачастные дисперсии определяются по формуле
т,
I b>iu - уi f
2 _ и - 1__________ |
(5.46) |
|
/И - 1 |
из уравнения (5.45) имеем
I I (Уш-У'Т
(5.47)
2 > / - и
/=1
Число степеней свободы общей дисперсии воспроизводимости, оп ределяемой по формуле (5.47), гораздо больше, чем у каждой дисперсии в отдельности. Поэтому общая дисперсия воспроизводимости намного точ нее оценивает дисперсию генеральной совокупности а 2
При вычислении дисперсии воспроизводимости по серии опытов объединяют только те пробы, которые можно рассматривать как выборки из генеральных совокупностей с равными дисперсиями.
5.6. Оценка дисперсии нормально распределенной случайной величины
Дисперсию генеральной совокупности су* нормально распределен
ной случайной величины можно оценить, если известно распределение ее
2 оценки - выборочной дисперсии sx .
При числе степеней свободы / < 30 распределение выборочной дис
персии можно получить с помощью распределения Пирсона или у2- рас пределения. В этом случае доверительные двусторонние границы для ге неральной дисперсии определяются выражением
f ix |
< а 2 < f i x |
(5.48) |
|
|
|
Х\-р/2 |
Хр/2 |
|
Для односторонней доверительной оценки используются соответст венно квантили % 1-р и Х2р •Значения квантилей распределения Пирсона
приведены в приложении 2.
При числе степеней свободы / > 30 доверительные границы для ге
нерального стандарта определяются неравенством |
|
|
и 1-р12 < а . < sr + |
и р / 2 * |
(5.49) |
л/27 |
V 27 |
|
5.7. Проверка однородности результатов измерений
При выполнении измерений могут встретиться результаты, значи тельно отличающиеся от других аналогичных. Причиной отличий могут быть неаккуратность выполнения замеров, поломка приборов, действи тельное отклонение параметра от среднестатистического (например, при язвенной коррозии материала стенки аппарата) и т.п. Наличие грубой ошибки (или отклонения) в выборке значений случайной величины нару шает характер распределения и изменяет его параметры, т.е. нарушает од нородность наблюдений. Поэтому выявление грубых ошибок можно трак товать как проверку однородности наблюдений, т.е. проверку гипотезы о том, что все элементы выборки получены из одной и той же генеральной совокупности.
Имеется выборка JCI, JC2, , хп значений случайной величины X.
Пусть хтгх и хт\п соответственно максимально и минимально допустимые значения измерений выборки. Если какой-либо результат измерения х,- ле-
жит за пределами интервала ( x m jn ч- :стах), то он будет считаться не принадлежащим к данной выборке и должен быть исключен из последующих расчетов. Значения хтах и хтт определяются по формулам
(5.50)
Значения и для различных уровней значимости и степеней свободы приведены в приложении 3.
6.ПЛАНИРОВАНИЕ ЭКСПЕРИМ ЕНТА
6.1.Основные понятия и определения
Ранее уже приводились некоторые основные понятия и определения из теории планирования эксперимента, рассмотрим их более подробно.
Планирование эксперимента - это процедура выбора числа и усло вий проведения опытов, необходимых и достаточных для решения постав ленной задачи с требуемой точностью. При этом существенно следующее: минимизация общего числа опытов; одновременное варьирование всеми факторами, определяющими процесс, по специальным правилам - алго ритмам; использование математического аппарата, формализующего мно гие действия экспериментатора; выбор четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов.
Целью планирования эксперимента является получение математиче ской модели объекта при минимальном количестве поставленных опытов. Под математической моделью в данном случае понимается уравнение свя зи между входными параметрами - факторами (*ь *2> —>*п) и выходными параметрами - параметрами оптимизации (уь у2, ...» ут\ В общем виде уравнение связи можно записать следующим образом: у = f{x\, х2,..., хп).
Задачи, для решения которых может быть использовано планирова ние эксперимента:
-поиск оптимальных условий ведения процесса;
-определение факторов, оказывающих наибольшее влияние на про
цесс;
-определение параметров теоретических моделей;
-исследование диаграмм состав-свойство и т.д.
Параметр оптимизации - это отклик (реакция) объекта на воздейст вие факторов. В зависимости от объекта и цели исследования параметры оптимизации могут быть: экономические; технико-экономические; техни ко-технологические и прочие. Множество значений, которые может при нимать параметр оптимизации, называется областью его определения.
Возможны два пути оптимизации исследуемого процесса.
Первый - из всех параметров оптимизации выбирается только один, самый важный (критерий), а остальные служат ограничениями.
Второй - построение обобщенного параметра оптимизации как не которой функции от множества исходных параметров.
Требования, предъявляемые к параметру оптимизации
Параметр оптимизации должен быть:
-количественным и выражаться одним числом;
-измеряемым, т.е. мы должны иметь возможность его измерять;
-однозначным в статистическом смысле, т.е. заданному значению факторов должно соответствовать только одно, с точностью до ошибки измерения, значение параметра оптимизации;
-универсальным, т.е. способным всесторонне характеризовать объ ект. В частности, технологические параметры недостаточно универсальны, т.к. они не учитывают экономику. Универсальностью обладают, например, обобщенные параметры оптимизации, которые строятся как функции от нескольких частных параметров;
-иметь физический смысл, быть простым и легко вычисляемым. Фактором называется какой-либо исходный параметр процесса, вы
бранный исследователем для воздействия на объект и принимающий в хо де проведения эксперимента различные значения. Так же, как и параметр оптимизации, каждый фактор имеет область определения. Фактор счита ется заданным, если вместе с его названием указана область его определе ния. Под областью определения фактора понимается совокупность всех его значений, которые он в принципе может принимать.
Факторы бывают качественные и количественные. Качественные факторы - это разные вещества, разные технологические способы, аппара ты, исполнители и т.п. Так как им не соответствует числовая шкала, для них строят условную порядковую шкалу, которая ставит в соответствие уровням качественного фактора числа натурального ряда. Например, если в качестве уровней варьирования фактора выбрано месторождение сырья, то каждому месторождению присваивается порядковый номер и закрепля ется за ним. Номера месторождений и будут представлять условную по рядковую шкалу. Количественный фактор представляет собой переменную величину, которую можно оценивать количественно: измерять, взвеши