
книги из ГПНТБ / Кадыров, Х. К. Синтез математических моделей биологических и медицинских систем
.pdfОсобенно сильно проявляются случайности в различных меди цинских исследованиях. Изучение факта случайности в медицин ских исследованиях с помощью математического моделирования на базе математического аппарата случайных процессов является весь ма перспективным и многообещающим. Математическое моделирова ние, описывающее случайные процессы, дает возможность опреде лить все основные численные характеристики сложных медико-био логических процессов [13].
На практике приходится оперировать с ограниченным количе ством экспериментальных данных. Следовательно, к методам обоб щения результатов эксперимента следует предъявлять требования, которые могли бы выявить характерные черты наблюдаемого явле ния, а все несущественные элементы, связанные со случайными от клонениями, отстранить. В связи с этим возникает задача сглажива ния или выравнивания статистических данных. При обработке ста тистических материалов, полученных в результате эксперимента, необходимо подбирать теоретическую кривую распределения. Задача нахождения теоретической кривой для статистических рядов со стоит в .подборе плавной кривой распределения, наилучшим образом описывающей данное распределение.
Задача о наилучшем выравнивании статистических рядов, как и вообще задача о наилучшем аналитическом представлении эм пирических данных, в значительной мере неопределенная и решение ее зависит от того, что считать наилучшим. Одним из универсальных математических методов для выбора наилучшей кривой является метод наименьших квадратов. При этом вопрос о том, в каком именно классе функций следует искать наилучшее приближение, решается уже не математически, а на основании соображений, связанных с природой исследуемого объекта, с учетом характера полученной эмпирической кривой. Принципиальный вид выбранной теоретичес кой кривой зависит от некоторых параметров. Задача выравнивания статических рядов переходит в задачу выбора параметров. В каче стве критерия выбора неизвестных параметров, наилучшим образом обеспечивающих описание исследуемого процесса, можно восполь
зоваться |
следующими |
характеристиками случайных величин [7]: |
|
а) |
математическим ожиданием исследуемых случайных величин, |
||
определяемым в случае, если случайные величины дискретны: |
|||
|
|
/И (х) = |
V Хірі. |
|
|
|
/=і |
Для |
непрерывных |
случайных |
величин |
|
|
|
оо |
|
|
М (х) = |
j xf (X) dx, |
— оо
где xt — конкретные значения случайной величины; pt — вероят ность принятия случайными величинами конкретного численного значения; f (х) — плотность распределения случайных величин; / (х) dx — элемент вероятности;
4* |
51 |
■б) центральными моментами случайных величин разного по
рядка: |
|
|
|
|
|
|
|
Ml = |
м [X ] = 2 |
[*, — М (*)] Рі = |
О, |
|
|||
|
|
;=і |
|
|
|
|
|
м2 = |
М [ > ] = |
V |
[xt - м (х)Г Рі = |
а , - M l, |
|
||
|
|
i=i |
|
|
|
|
|
Мз = |
м [X3] = |
2 |
Iхі — Мх?Рі = “ з — з а2Мх + 2 М\, |
|
|||
|
|
і=1 |
|
|
|
|
|
м4 = М [ * 4] = S |
|
— М |
Рі = а 4 — 4 0 ^ + 7 а 2/И* — 3 М Х4, |
||||
|
|
і=і |
|
|
|
|
|
где |
|
|
|
|
п |
I |
|
|
|
|
|
|
|
||
|
|
|
|
а / = 2 |
х^ ‘'; |
|
|
|
|
|
|
|
*=1 |
|
|
|
|
|
|
м х = 2 |
|
|
|
|
|
|
|
|
«=1 |
|
|
в) коэффициентом |
асимметрии, |
характеризующим |
меру асим |
||||
|
|
|
9 |
_ _рз_ _ |
«з — Шхаг+ 2М-1 |
|
|
метрии законов распределений случайных величин: |
|
||||||
|
|
|
k |
°3 |
[V а , — МХ2]3 |
|
|
С помощью характеристики Sk получим некоторое |
предположе- |
ние о смещении кривой распределения случайной величины вправо или влево от исходного закона распределения. Если Sk > 0, то кривая распределения будет сдвинута в левую сторону (положи тельная асимметрия), если S k < 0, то кривая распределения будет смещена вправо (отрицательная асимметрия);
г) коэффициентом крутизны закона распределения случайных величин или эксцесс:
Ех = - |
3 |
^4 _ |
а„ — 4а3Мх + 7М2х — ЗМ* |
|
■3. |
||
|
|
|
[Ѵа2- М 2х]* |
С помощью этого показателя можно получить представление о крутизне или плосковершинности закона распределения случайных величин. Если Ех > 0, то кривая распределения будет иметь острую вершину, а если Ех < 0, то она будет иметь плоскую вершину. На конец, если Ех = 0, то мы получим подтверждение того, что закон распределения исследуемых случайных величин подчиняется нор мальному закону распределения.
Счедовательно, имея в распоряжении все эти показатели, легко делать выводы о законе распределения исследуемых случайных ве личин. Далее остается принять критерий близости законов распре деления рассматриваемых случайных величин на сопоставление
52
с законом случайных процессов, описываемых соотношением
Ф — fi (х>а) (/ = 1, е),
аналитический выход которых задается последовательно. В мате матике разработано множество критериев для оценки близости зако нов распределений исследуемых случайных величин тому или иному закону распределения. Для такой оценки мы принимаем критерий «хи-квадрат» X2.
Процесс оценки близости законов распределений с помощью X2 выполняется в следующей последовательности.
1.Все численные характеристики исследуемой случайной ве личины вносятся в предъявляемый закон, т. е. Ф = / (ах, Мх, х, і).
2.Вычисляется показатель согласованности по формулам
X2 = я У |
(Р/ — Р{) |
(2.18) |
2_j |
|
|
і=і |
|
|
или более проще |
|
|
( т і — n p t ) |
|
|
|
^P: |
|
где Pi = ~ — статистическая |
вероятность; |
mt — благоприятст |
вующий случай, т. е. количество повторений данной величины при я опытах; я — общее число наблюдений.
Как известно показатель согласованности X2 зависит от степеней свободы рассматриваемой случайной величины г. Это число г равно числу разрядов минус число связей, наложенных на частоту рр
1)
|
t=i |
|
|
|
2) |
М [X] = 2 хіРі = |
Мх |
|
|
|
і=і |
|
|
|
3) |
М[х — Мх]2 = |
2 |
(Xt - Мху Pi = Dx, |
|
|
|
i = |
1 |
|
где Xi — дискретные значения |
случайных |
величин; Мх — матема |
||
тическое ожидание случайных |
величин; |
Dx — дисперсия случай |
ных величин, характеризующая разброс дискретных значений слу чайной величины вокруг своего математического ожидания.
Исходя из численных значений X2, с помощью формул (2.18) вычислен показатель согласованности и построены специальные
таблицы. При |
помощи этих таблиц для |
каждого значения |
и чис |
||
ла степени свободы можно выбрать вероятность того, что |
закон |
||||
распределения |
исследуемой случайной |
величины |
близок |
к |
за |
кону распределения ф/ = //(х ) Таким |
образом, с |
помощью |
X2 |
можно оценить степень согласованности закона распределения ис следуемой случайной величины с законом, предъявляемым в виде
53
ф/ = fj (X). Из изложенного выше ясно, что процесс отыскания за конов распределений исследуемых случайных величин связан с огромными вычислительными трудностями. Выполнение всех вы числительных процедур вручную сводит на нет всю ценность описы ваемых методик отыскания законов распределений. Для избежания этой трудности необходимо при решении подобных задач приме нять современные электронные цифровые вычислительные машины.
Алгоритмы вычисления основных показателей вариационной ста тистики. Основным исходным понятием математической статисти ки является понятие «вариационного ряда». Варианты (члены) ряда могут быть численными показателями, являющимися результатом наблюдений или экспериментов, или представленными в виде гра фических изображений, характеризующих некоторый процесс. Од нако обычно полученный на основе наблюдений ряд является только частью генеральной совокупности. Наблюдения и эксперименты не могут быть бесконечными. Очень важным поэтому является выбор метода обработки выборки, с помощью которого можно было бы наи более достоверно судить о генеральной совокупности. Для этого необходимо предварительно определить следующие показатели [13]:
1)среднее арифметическое, характеризующее данный вариаци онный ряд (Мх); колебания от средней арифметической ошибки в ту или иную сторону — среднеквадратическое отклонение (ох) и про цент колебания — коэффициент вариации (Vх);
2)стандартные ошибки и доверительные границы (т (Мх),
т(ох), т (Ѵх)) для этих показателей;
3)достоверность разницы между вариационными рядами.
Степень приближенности статистических показателей к истин ному значению зависит, во-первых, от числа наблюдений, во-вто рых, от однородности данного вариационного ряда. Поэтому вариа ционный ряд группируется в зависимости от однородности его чле нов. Кроме того, сходимость показателей зависит и от качественной однородности ряда. Например, при определении длины стопы уче ников в одном классе нужно группировать полученные данные по возрасту и полу. В противном случае полученные вариационные ря ды будут плохо характеризовать этот антропологический признак.
Статистическая обработка результатов наблюдений состоит в следующем. Пусть в результате экспериментальных или клиниче ских исследований получены такие совокупности случайных ве личин:
где Х( (і = 1, п) — результаты наблюдений; р( — соответствующие вероятности.
Математическое ожидание этих случайных величин определяется по соответствующим вероятностям в виде
^ |
_ х іРі ~Ь х гРг 4~ |
• ' ' |
~Ь х пРп |
(2.19) |
|
Р\ + Рг + |
' ‘ ' |
+ Рп |
|
54
иди
н
(2.20)
/=1
л
Если yj Pt ~ 1. то
І = 1
П
2 хіРі- (2 . 21)
і=1
При большом числе наблюдений среднее арифметическое наблю даемых значений случайной величины приближается к ее матема тическому ожиданию. Из наличия связи между частотой и вероят ностью можно получить, как следствие, наличие подобной же связи между средним арифметическим и математическим ожиданием. Пред
положим, что значение хг то наблюдения появилось в выборке ти
к
Xj-го — т2, хк-го — mk раз Очевидно, 2 ті — |
п, где п — число |
||
|
|
;=і |
|
наблюдений. Вычислим среднее арифметическое |
|
||
_ х 1т 1 + х 2т 2 |
• + х кт к _ |
■хх + |
+ п хк> |
|
|
ИЛИ
(2. 22)
где —- — статистическая частота.
п
Далее, обозначая эту частоту буквой рі , математическое ожида ние можно переписать в виде
М ( X ) = 2 хфи |
(2.23) |
(=і |
|
значит, среднее арифметическое наблюдаемых значений случайной величины равно сумме произведений всех возможных значений слу чайной величины на частоту этих значений.
При увеличении числа опытов частота р\ будет приближаться к
соответствующим вероятностям pt, т. е. pt = lim р'\ вместе с ними
П-+ОО
Мх приближается к математическому ожиданию. Степень рассе ивания определяется так же, как математическое ожидание, и она имеет вид следующей таблицы распределения:
хх— М (х), х2 — М (X), . . . . х„ — М (х)
(2.24)
P i t |
P i t • • * I Р п |
55
Вычислим среднюю величину отклонения
£ * (* ) = 2 [*£- М (*)]/>/’. |
(2.25) |
1=1 |
|
Для второго порядка среднюю величину отклонения получаем как |
||||
[Я* (*)]2 = |
!2= | |
А - |
М(X)fp]\ |
(2.26) |
Если в этом выражении заменить математическое ожидание его средним арифметическим, то мы получим так называемую статисти ческую дисперсию
А = |
2 Г* - м X |
(2.27) |
|
і=і |
|
Дисперсия случайной величины имеет размерность ее квадрата. Для наглядной характеристики рассеивания удобнее пользоваться величиной, размерность которой совпадает с размерностью случай ной величины. Для этого из величины дисперсии извлекают квадрат ный корень. Полученная величина называется средним квадрати ческим отклонением и обозначается так:
с г ( х ) = 1У/ I t e - M W f P e
і1 =\і
В математической статистике показано, что дисперсия выборки,
умноженная на поправку 1 , примерно равна дисперсии сово
купности, т. е.
- | / È (Хс - М х)2
Следовательно, испытав лишь часть генеральной совокупности, можно характеризовать дисперсию всей генеральной совокупности.
В качестве относительной характеристики рассеивания исполь зуется коэффициент вариации, и он показывает, насколько велико рассеивание по сравнению со средним значением случайной величи ны:
т % -
При очень большом числе наблюдений среднее арифметическое с большой вероятностью будет приближаться к математическому ожиданию. Если же число наблюдений невелико, то замена матема тического ожидания средним арифметическим приводит к опреде ленной ошибке. То же самое относится к оценке других неизвестных параметров. Дисперсия выборочной средней или стандартная ошиб-
56
ка средней арифметической определяется следующим образом:
т(Мх |
Ох |
/ к |
(п~ 1) |
|
т |
||||
|
Аналогично будем определять стандартную ошибку среднеквад ратического отклонения и коэффициента вариации:
|
|
п |
|
|
|
Ох |
^ I \х[ Мх)~ |
|
|
т ІРх) = |
1=I |
т {Vх) = |
|
|
}/2п |
2п (п — 1) ’ |
/ 2 п |
По формулам получаем значения оценок среднего арифметиче ского, среднего квадратического отклонения и коэффициента вариа ции.
Чтобы иметь представление о точности, пользуются понятием доверительного интервала, который для среднего арифметического определяется следующим образом:
Р {Мх — t(,m (Мх) < |
М0< |
Мх + |
t$m (MJ) = ß, |
или |
М0< |
у2) = |
ß, |
Р (7! < |
|||
где |
|
|
|
Уі = Мх ~ t ß - т(Мх); |
|||
Ѵг = Mx+ t f |
т (Мху, |
ß — доверительная вероятность; М0 — истинное значение, характе ризующее генеральную совокупность; t$ — в зависимости от вели чины ß дается в таблице (значения Лапласа).
Далее будем определять доверительные интервалы средней квад
ратической ошибки |
|
|
|
|
Р \ох — fp • m (a j < |
ст0 < |
стх + |
• т(ох)), |
|
или |
|
стп < |
а„), |
(2.28> |
Р (аг< |
||||
где |
— t f m |
|
|
|
а і = |
(стх); |
|
||
«2 = |
Ох + |
h • т (ахУ> |
|
а0 — истинное значение.
Во многих случаях конечный результат исследования зависит от различия между найденными экспериментально величинами. Например, пусть с помощью клинических исследований проверя ется какой-нибудь новый метод или новый препарат. Иначе говоря, исследователь определяет средние значения по экспериментально полученному ряду и сравнивает найденные результаты. При этом нельзя забывать, что различия среднего значения могут быть вы званы случайными причинами. Поэтому в вариационной статисти ке для определения существенное™ различия двух нормальных
57
распределений пользуются следующей формулой:
S _ ______ М д — М х______ |
(2.29) |
||
V |
m { M y f + m { M Kf ' |
||
|
где Мх — среднее арифметическое значение до опыта; М„ — сред
нее арифметическое |
значение |
после опыта; |
т (Мх), т (Му) — со |
ответствующие стандартные ошибки средних величин. |
|||
При соблюдении |
условий |
t >> tra6, где |
Ъаб — табличное зна |
чение, различие между математическими ожиданиями случайных ве личин можно считать существенным. Различие можно признать существенным с вероятностью р = 0,95 при соблюдении условия, выражаемого формулой t > 2.
Для оценки достоверности различия при более строгом уровне
вероятности |
р = 0,99 следует применять аналогичную формулу, |
||||
отличающуюся |
от |
предыдущей |
только |
коэффициентом t > 2,7. |
|
Таким образом, |
эта оценка позволяет объективно оценить суще |
||||
ственность |
наблюдаемых различий. |
нормального распределе |
|||
Алгоритм |
поиска параметров |
закона |
ния. В природе существует ряд явлений, законы распределения ко торых можно описывать плавными кривыми. В математической ста тистике разработано несколько законов распределений, для которых даны плотности вероятностей. Во многих исследованиях применяют ся законы распределения Пуассона — Лапласа, особенно, когда чис ло наблюдений или испытаний велико и, кроме того, когда статисти ческое распределение однообразно. В статистике фундаментальным законом распределения является нормальный или гауссовский за кон распределения. Принципиальная особенность этого закона по отношению к другим состоит в том, что он является предельным законом, к которому стремятся все остальные законы распределения в определенных типичных условиях. Кроме того, этот закон имеет минимальное число параметров, легко определяемых по эксперимен тальным данным. С этой точки зрения он является простейшим за коном распределения и относится к типу непрерывного распределе ния с плотностью
( х - М )
где М — средняя величина данного статистического распределения; о — среднеквадратическое отклонение; х — варианта данного ряда (случайная переменная ); л, е — известные постоянные величины.
Средняя величина а и среднеквадратическое отклонение опреде ляются соответственно по следующим формулам:
п |
|
2 |
(* ,- my |
a = / |
п — 1 |
58
При анализе эмпирических распределений важное значение име ет вычисление показателей симметрии и эксцесса, для чего необ ходимо определить моменты разного порядка. Если мы будем рас сматривать распределения
X = Х |
* 1. * 2. |
|
|
Рі> Рг< |
|
где х{ — конкретные значения |
случайной величины, полученные |
|
в результате эксперимента; |
pt — соответствующие вероятности, |
|
то моменты разного порядка определяются по формуле |
||
= |
2 |
(*; —a)kPh |
|
t= 1 |
где а — произвольно выбранная константа.
Моменты по отношению к константе а разделяются на начальные, когда а = 0; центральные, когда а = М\ условные, когда а ф М,
а Ф 0.
Центральные моменты применяются в анализе эмпирических распределений для характеристики дисперсии, асимметрии и экс цесса. Центральные моменты разного порядка вычисляются по сле дующим формулам:
рх = а г — М — первого порядка, р2 = а 2 — (М)г — второго порядка,
р3 = а3— ЗМа2-j- 2М3— третьего порядка,
р4 = а 4 — 4Мх3 + 6М2а2+ 3Мі — четвертого порядка,
где
і= І
Далее воспользуемся конкретными моментами третьего и четвер того порядков. В случае симметрического распределения нечетные центральные моменты равны нулю. Поэтому, если третий момент не равен нулю, то это свидетельствует об асимметрии распределе ния. Исходя из центрального момента третьего порядка, определим асимметрию
А = |
і = і |
|
А— характеризует асимметрию распределения.
Спомощью параметра А мы получаем некоторые предположения
оформе исследуемого статистического ряда. Распределение счита ется почти симметричным, если |Л| < 0,1, и сильно асимметричным,
если \А\ >■ 0,5. Если А > 0, то асимметрия положительна, |
при А < |
•< 0 — отрицательна. Далее, с помощью центрального |
момента |
59
четвертого порядка р,4 определяем эксцесс Е по формуле
Р а 4 — Ш а 3 + 6М2а 3 + ЗМ4
К - (М)3]4
На основании параметра Е мы получаем сведения о крутизне кривой. Если Е <. О, то кривая вогнута по сравнению с нормальной кривой, если Е > 0 — она заострена сверху. Распределение счита ется близким к нормальному, если |Д| < 0,1, и значительно откло няющимся от нормального, если |Д| > 0,5.
Далее выдвигается гипотеза о том, что закон распределеная'рассматриваемых случайных процессов близок к закону нормального распределения. В математической статистике разработано мно жество критериев для оценки достоверности принятых допущений о распределениях. Некоторые из них справедливы лишь для определе ния моделей, другие применимы для широкого класса законов рас пределений. Мы будем использовать для проверки любого распреде ления критерий хи-квадрат Пирсона, который определяется по
формуле |
(2.18), |
где |
pt — значения вероятности теоретического |
распределения; |
р\ — значения вероятности эмпирического распре |
||
деления; |
п — число |
наблюдений. |
|
Для |
определения |
значений теоретического распределения ста |
тистический ряд необходимо разделить на классы, а затем опреде лять вероятности совпадения случайных величин на участках между двумя классами. Эта вероятность находится по формуле
Pt {ßi-i < М < ß,} = Ф (ß,) - Ф (ß,-i),
где ф (ßt) — значение функции распределения, соответствующее высшей границе класса і; Ф (ß(—і) — значение функции распреде
ления, соответствующее высшей границе |
предшествующего |
класса |
|
і — 1. |
численных значений функций |
распределений ф |
(ß,) и |
Для |
|||
Ф (ßi—і) |
разработаны специальные таблицы. Численные значения |
эмпирического распределения определяются следующим отноше нием:
где с,- — число наблюдений, появляющихся в і классе.
По формуле (2.30) определяется численное значение X2, а затем по числу степеней свободы из специальной таблицы находится веро ятность близости эмпирической кривой распределения к нормаль ному закону распределения. Итак, при помощи критерия Пирсона оценивается степень согласованности эмпирического закона распре деления с нормальным законом распределения.
Из изложенного выше очевидно, что исследование случайных величин, описывающих некоторые случайные процессы и определе ние законов их распределения, требует выполнения большого коли чества вычислительных работ, чего нельзя осуществить без при влечения современных электронных вычислительных машин.
60