Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Кадыров, Х. К. Синтез математических моделей биологических и медицинских систем

.pdf
Скачиваний:
13
Добавлен:
20.10.2023
Размер:
7.65 Mб
Скачать

Особенно сильно проявляются случайности в различных меди­ цинских исследованиях. Изучение факта случайности в медицин­ ских исследованиях с помощью математического моделирования на базе математического аппарата случайных процессов является весь­ ма перспективным и многообещающим. Математическое моделирова­ ние, описывающее случайные процессы, дает возможность опреде­ лить все основные численные характеристики сложных медико-био­ логических процессов [13].

На практике приходится оперировать с ограниченным количе­ ством экспериментальных данных. Следовательно, к методам обоб­ щения результатов эксперимента следует предъявлять требования, которые могли бы выявить характерные черты наблюдаемого явле­ ния, а все несущественные элементы, связанные со случайными от­ клонениями, отстранить. В связи с этим возникает задача сглажива­ ния или выравнивания статистических данных. При обработке ста­ тистических материалов, полученных в результате эксперимента, необходимо подбирать теоретическую кривую распределения. Задача нахождения теоретической кривой для статистических рядов со­ стоит в .подборе плавной кривой распределения, наилучшим образом описывающей данное распределение.

Задача о наилучшем выравнивании статистических рядов, как и вообще задача о наилучшем аналитическом представлении эм­ пирических данных, в значительной мере неопределенная и решение ее зависит от того, что считать наилучшим. Одним из универсальных математических методов для выбора наилучшей кривой является метод наименьших квадратов. При этом вопрос о том, в каком именно классе функций следует искать наилучшее приближение, решается уже не математически, а на основании соображений, связанных с природой исследуемого объекта, с учетом характера полученной эмпирической кривой. Принципиальный вид выбранной теоретичес­ кой кривой зависит от некоторых параметров. Задача выравнивания статических рядов переходит в задачу выбора параметров. В каче­ стве критерия выбора неизвестных параметров, наилучшим образом обеспечивающих описание исследуемого процесса, можно восполь­

зоваться

следующими

характеристиками случайных величин [7]:

а)

математическим ожиданием исследуемых случайных величин,

определяемым в случае, если случайные величины дискретны:

 

 

/И (х) =

V Хірі.

 

 

 

/=і

Для

непрерывных

случайных

величин

 

 

 

оо

 

 

М (х) =

j xf (X) dx,

— оо

где xt — конкретные значения случайной величины; pt — вероят­ ность принятия случайными величинами конкретного численного значения; f (х) — плотность распределения случайных величин; / (х) dx — элемент вероятности;

4*

51

■б) центральными моментами случайных величин разного по­

рядка:

 

 

 

 

 

 

 

Ml =

м [X ] = 2

[*, — М (*)] Рі =

О,

 

 

 

;=і

 

 

 

 

 

м2 =

М [ > ] =

V

[xt - м (х)Г Рі =

а , - M l,

 

 

 

i=i

 

 

 

 

Мз =

м [X3] =

2

Iхі Мх?Рі = “ з — з а2Мх + 2 М\,

 

 

 

і=1

 

 

 

 

м4 = М [ * 4] = S

 

М

Рі = а 4 — 4 0 ^ + 7 а 2/И* — 3 М Х4,

 

 

і=і

 

 

 

 

 

где

 

 

 

 

п

I

 

 

 

 

 

 

 

 

 

 

 

а / = 2

х^ ‘';

 

 

 

 

 

 

*=1

 

 

 

 

 

м х = 2

 

 

 

 

 

 

 

«=1

 

в) коэффициентом

асимметрии,

характеризующим

меру асим­

 

 

 

9

_ _рз_ _

«з — Шхаг+ 2М-1

 

метрии законов распределений случайных величин:

 

 

 

 

k

°3

[V а , МХ2]3

 

С помощью характеристики Sk получим некоторое

предположе-

ние о смещении кривой распределения случайной величины вправо или влево от исходного закона распределения. Если Sk > 0, то кривая распределения будет сдвинута в левую сторону (положи­ тельная асимметрия), если S k < 0, то кривая распределения будет смещена вправо (отрицательная асимметрия);

г) коэффициентом крутизны закона распределения случайных величин или эксцесс:

Ех = -

3

^4 _

а„ — 4а3Мх + 7М2х — ЗМ*

 

■3.

 

 

 

[Ѵа2- М 2х]*

С помощью этого показателя можно получить представление о крутизне или плосковершинности закона распределения случайных величин. Если Ех > 0, то кривая распределения будет иметь острую вершину, а если Ех < 0, то она будет иметь плоскую вершину. На­ конец, если Ех = 0, то мы получим подтверждение того, что закон распределения исследуемых случайных величин подчиняется нор­ мальному закону распределения.

Счедовательно, имея в распоряжении все эти показатели, легко делать выводы о законе распределения исследуемых случайных ве­ личин. Далее остается принять критерий близости законов распре­ деления рассматриваемых случайных величин на сопоставление

52

с законом случайных процессов, описываемых соотношением

Ф — fi (х>а) (/ = 1, е),

аналитический выход которых задается последовательно. В мате­ матике разработано множество критериев для оценки близости зако­ нов распределений исследуемых случайных величин тому или иному закону распределения. Для такой оценки мы принимаем критерий «хи-квадрат» X2.

Процесс оценки близости законов распределений с помощью X2 выполняется в следующей последовательности.

1.Все численные характеристики исследуемой случайной ве­ личины вносятся в предъявляемый закон, т. е. Ф = / (ах, Мх, х, і).

2.Вычисляется показатель согласованности по формулам

X2 = я У

(Р/ — Р{)

(2.18)

2_j

 

 

і=і

 

 

или более проще

 

 

( т і n p t )

 

 

^P:

 

где Pi = ~ — статистическая

вероятность;

mt — благоприятст­

вующий случай, т. е. количество повторений данной величины при я опытах; я — общее число наблюдений.

Как известно показатель согласованности X2 зависит от степеней свободы рассматриваемой случайной величины г. Это число г равно числу разрядов минус число связей, наложенных на частоту рр

1)

 

t=i

 

 

 

2)

М [X] = 2 хіРі =

Мх

 

 

і=і

 

 

 

3)

М[х Мх]2 =

2

(Xt - Мху Pi = Dx,

 

 

i =

1

 

где Xi — дискретные значения

случайных

величин; Мх — матема­

тическое ожидание случайных

величин;

Dx — дисперсия случай­

ных величин, характеризующая разброс дискретных значений слу­ чайной величины вокруг своего математического ожидания.

Исходя из численных значений X2, с помощью формул (2.18) вычислен показатель согласованности и построены специальные

таблицы. При

помощи этих таблиц для

каждого значения

и чис­

ла степени свободы можно выбрать вероятность того, что

закон

распределения

исследуемой случайной

величины

близок

к

за­

кону распределения ф/ = //(х ) Таким

образом, с

помощью

X2

можно оценить степень согласованности закона распределения ис­ следуемой случайной величины с законом, предъявляемым в виде

53

ф/ = fj (X). Из изложенного выше ясно, что процесс отыскания за­ конов распределений исследуемых случайных величин связан с огромными вычислительными трудностями. Выполнение всех вы­ числительных процедур вручную сводит на нет всю ценность описы­ ваемых методик отыскания законов распределений. Для избежания этой трудности необходимо при решении подобных задач приме­ нять современные электронные цифровые вычислительные машины.

Алгоритмы вычисления основных показателей вариационной ста­ тистики. Основным исходным понятием математической статисти­ ки является понятие «вариационного ряда». Варианты (члены) ряда могут быть численными показателями, являющимися результатом наблюдений или экспериментов, или представленными в виде гра­ фических изображений, характеризующих некоторый процесс. Од­ нако обычно полученный на основе наблюдений ряд является только частью генеральной совокупности. Наблюдения и эксперименты не могут быть бесконечными. Очень важным поэтому является выбор метода обработки выборки, с помощью которого можно было бы наи­ более достоверно судить о генеральной совокупности. Для этого необходимо предварительно определить следующие показатели [13]:

1)среднее арифметическое, характеризующее данный вариаци­ онный ряд (Мх); колебания от средней арифметической ошибки в ту или иную сторону — среднеквадратическое отклонение (ох) и про­ цент колебания — коэффициент вариации (Vх);

2)стандартные ошибки и доверительные границы (т (Мх),

т(ох), т (Ѵх)) для этих показателей;

3)достоверность разницы между вариационными рядами.

Степень приближенности статистических показателей к истин­ ному значению зависит, во-первых, от числа наблюдений, во-вто­ рых, от однородности данного вариационного ряда. Поэтому вариа­ ционный ряд группируется в зависимости от однородности его чле­ нов. Кроме того, сходимость показателей зависит и от качественной однородности ряда. Например, при определении длины стопы уче­ ников в одном классе нужно группировать полученные данные по возрасту и полу. В противном случае полученные вариационные ря­ ды будут плохо характеризовать этот антропологический признак.

Статистическая обработка результатов наблюдений состоит в следующем. Пусть в результате экспериментальных или клиниче­ ских исследований получены такие совокупности случайных ве­ личин:

где Х( (і = 1, п) — результаты наблюдений; р( — соответствующие вероятности.

Математическое ожидание этих случайных величин определяется по соответствующим вероятностям в виде

^

_ х іРі х гРг 4~

• ' '

х пРп

(2.19)

 

Р\ + Рг +

' ‘ '

+ Рп

 

54

иди

н

(2.20)

/=1

л

Если yj Pt ~ 1. то

І = 1

П

2 хіРі- (2 . 21)

і=1

При большом числе наблюдений среднее арифметическое наблю­ даемых значений случайной величины приближается к ее матема­ тическому ожиданию. Из наличия связи между частотой и вероят­ ностью можно получить, как следствие, наличие подобной же связи между средним арифметическим и математическим ожиданием. Пред­

положим, что значение хг то наблюдения появилось в выборке ти

к

Xj-го — т2, хк-го mk раз Очевидно, 2 ті —

п, где п — число

 

 

;=і

 

наблюдений. Вычислим среднее арифметическое

 

_ х 1т 1 + х 2т 2

• + х кт к _

хх +

+ п хк>

 

 

ИЛИ

(2. 22)

где —- — статистическая частота.

п

Далее, обозначая эту частоту буквой рі , математическое ожида­ ние можно переписать в виде

М ( X ) = 2 хфи

(2.23)

(=і

 

значит, среднее арифметическое наблюдаемых значений случайной величины равно сумме произведений всех возможных значений слу­ чайной величины на частоту этих значений.

При увеличении числа опытов частота р\ будет приближаться к

соответствующим вероятностям pt, т. е. pt = lim р'\ вместе с ними

П-+ОО

Мх приближается к математическому ожиданию. Степень рассе­ ивания определяется так же, как математическое ожидание, и она имеет вид следующей таблицы распределения:

ххМ (х), х2 — М (X), . . . . х„ — М (х)

(2.24)

P i t

P i t • • * I Р п

55

Вычислим среднюю величину отклонения

£ * (* ) = 2 [*£- М (*)]/>/’.

(2.25)

1=1

 

Для второго порядка среднюю величину отклонения получаем как

[Я* (*)]2 =

!2= |

А -

М(X)fp]\

(2.26)

Если в этом выражении заменить математическое ожидание его средним арифметическим, то мы получим так называемую статисти­ ческую дисперсию

А =

2 Г* - м X

(2.27)

 

і=і

 

Дисперсия случайной величины имеет размерность ее квадрата. Для наглядной характеристики рассеивания удобнее пользоваться величиной, размерность которой совпадает с размерностью случай­ ной величины. Для этого из величины дисперсии извлекают квадрат­ ный корень. Полученная величина называется средним квадрати­ ческим отклонением и обозначается так:

с г ( х ) = 1У/ I t e - M W f P e

і1 =\і

В математической статистике показано, что дисперсия выборки,

умноженная на поправку 1 , примерно равна дисперсии сово­

купности, т. е.

- | / È (Хс - М х)2

Следовательно, испытав лишь часть генеральной совокупности, можно характеризовать дисперсию всей генеральной совокупности.

В качестве относительной характеристики рассеивания исполь­ зуется коэффициент вариации, и он показывает, насколько велико рассеивание по сравнению со средним значением случайной величи­ ны:

т % -

При очень большом числе наблюдений среднее арифметическое с большой вероятностью будет приближаться к математическому ожиданию. Если же число наблюдений невелико, то замена матема­ тического ожидания средним арифметическим приводит к опреде­ ленной ошибке. То же самое относится к оценке других неизвестных параметров. Дисперсия выборочной средней или стандартная ошиб-

56

ка средней арифметической определяется следующим образом:

т(Мх

Ох

/ к

(п~ 1)

т

 

Аналогично будем определять стандартную ошибку среднеквад­ ратического отклонения и коэффициента вариации:

 

 

п

 

 

 

Ох

^ I \х[ Мх)~

 

 

т ІРх) =

1=I

т {Vх) =

 

}/2п

2п (п — 1) ’

/ 2 п

По формулам получаем значения оценок среднего арифметиче­ ского, среднего квадратического отклонения и коэффициента вариа­ ции.

Чтобы иметь представление о точности, пользуются понятием доверительного интервала, который для среднего арифметического определяется следующим образом:

Р {Мх t(,m (Мх) <

М0<

Мх +

t$m (MJ) = ß,

или

М0<

у2) =

ß,

Р (7! <

где

 

 

 

Уі = Мх ~ t ß - т(Мх);

Ѵг = Mx+ t f

т (Мху,

ß — доверительная вероятность; М0 — истинное значение, характе­ ризующее генеральную совокупность; t$ — в зависимости от вели­ чины ß дается в таблице (значения Лапласа).

Далее будем определять доверительные интервалы средней квад­

ратической ошибки

 

 

 

 

Р \ох — fp • m (a j <

ст0 <

стх +

т(ох)),

или

 

стп <

а„),

(2.28>

Р (аг<

где

— t f m

 

 

а і =

(стх);

 

«2 =

Ох +

h т (ахУ>

 

а0 — истинное значение.

Во многих случаях конечный результат исследования зависит от различия между найденными экспериментально величинами. Например, пусть с помощью клинических исследований проверя­ ется какой-нибудь новый метод или новый препарат. Иначе говоря, исследователь определяет средние значения по экспериментально полученному ряду и сравнивает найденные результаты. При этом нельзя забывать, что различия среднего значения могут быть вы­ званы случайными причинами. Поэтому в вариационной статисти­ ке для определения существенное™ различия двух нормальных

57

распределений пользуются следующей формулой:

S _ ______ М д М х______

(2.29)

V

m { M y f + m { M Kf '

 

где Мх — среднее арифметическое значение до опыта; М„ — сред­

нее арифметическое

значение

после опыта;

т (Мх), т (Му) — со­

ответствующие стандартные ошибки средних величин.

При соблюдении

условий

t >> tra6, где

Ъаб — табличное зна­

чение, различие между математическими ожиданиями случайных ве­ личин можно считать существенным. Различие можно признать существенным с вероятностью р = 0,95 при соблюдении условия, выражаемого формулой t > 2.

Для оценки достоверности различия при более строгом уровне

вероятности

р = 0,99 следует применять аналогичную формулу,

отличающуюся

от

предыдущей

только

коэффициентом t > 2,7.

Таким образом,

эта оценка позволяет объективно оценить суще­

ственность

наблюдаемых различий.

нормального распределе­

Алгоритм

поиска параметров

закона

ния. В природе существует ряд явлений, законы распределения ко­ торых можно описывать плавными кривыми. В математической ста­ тистике разработано несколько законов распределений, для которых даны плотности вероятностей. Во многих исследованиях применяют­ ся законы распределения Пуассона — Лапласа, особенно, когда чис­ ло наблюдений или испытаний велико и, кроме того, когда статисти­ ческое распределение однообразно. В статистике фундаментальным законом распределения является нормальный или гауссовский за­ кон распределения. Принципиальная особенность этого закона по отношению к другим состоит в том, что он является предельным законом, к которому стремятся все остальные законы распределения в определенных типичных условиях. Кроме того, этот закон имеет минимальное число параметров, легко определяемых по эксперимен­ тальным данным. С этой точки зрения он является простейшим за­ коном распределения и относится к типу непрерывного распределе­ ния с плотностью

( х - М )

где М — средняя величина данного статистического распределения; о — среднеквадратическое отклонение; х — варианта данного ряда (случайная переменная ); л, е — известные постоянные величины.

Средняя величина а и среднеквадратическое отклонение опреде­ ляются соответственно по следующим формулам:

п

 

2

(* ,- my

a = /

п — 1

58

При анализе эмпирических распределений важное значение име­ ет вычисление показателей симметрии и эксцесса, для чего необ­ ходимо определить моменты разного порядка. Если мы будем рас­ сматривать распределения

X = Х

* 1. * 2.

 

Рі> Рг<

где х{ — конкретные значения

случайной величины, полученные

в результате эксперимента;

pt — соответствующие вероятности,

то моменты разного порядка определяются по формуле

=

2

(*; —a)kPh

 

t= 1

где а — произвольно выбранная константа.

Моменты по отношению к константе а разделяются на начальные, когда а = 0; центральные, когда а = М\ условные, когда а ф М,

а Ф 0.

Центральные моменты применяются в анализе эмпирических распределений для характеристики дисперсии, асимметрии и экс­ цесса. Центральные моменты разного порядка вычисляются по сле­ дующим формулам:

рх = а г — М — первого порядка, р2 = а 2 — (М)г — второго порядка,

р3 = а3ЗМа2-j- 2М3— третьего порядка,

р4 = а 4 — 4Мх3 + 6М2а2+ 3Мі — четвертого порядка,

где

і= І

Далее воспользуемся конкретными моментами третьего и четвер­ того порядков. В случае симметрического распределения нечетные центральные моменты равны нулю. Поэтому, если третий момент не равен нулю, то это свидетельствует об асимметрии распределе­ ния. Исходя из центрального момента третьего порядка, определим асимметрию

А =

і = і

 

А— характеризует асимметрию распределения.

Спомощью параметра А мы получаем некоторые предположения

оформе исследуемого статистического ряда. Распределение счита­ ется почти симметричным, если |Л| < 0,1, и сильно асимметричным,

если \А\ >■ 0,5. Если А > 0, то асимметрия положительна,

при А <

•< 0 — отрицательна. Далее, с помощью центрального

момента

59

четвертого порядка р,4 определяем эксцесс Е по формуле

Р а 4 — Ш а 3 + 6М2а 3 + ЗМ4

К - (М)3]4

На основании параметра Е мы получаем сведения о крутизне кривой. Если Е <. О, то кривая вогнута по сравнению с нормальной кривой, если Е > 0 — она заострена сверху. Распределение счита­ ется близким к нормальному, если |Д| < 0,1, и значительно откло­ няющимся от нормального, если |Д| > 0,5.

Далее выдвигается гипотеза о том, что закон распределеная'рассматриваемых случайных процессов близок к закону нормального распределения. В математической статистике разработано мно­ жество критериев для оценки достоверности принятых допущений о распределениях. Некоторые из них справедливы лишь для определе­ ния моделей, другие применимы для широкого класса законов рас­ пределений. Мы будем использовать для проверки любого распреде­ ления критерий хи-квадрат Пирсона, который определяется по

формуле

(2.18),

где

pt — значения вероятности теоретического

распределения;

р\ — значения вероятности эмпирического распре­

деления;

п — число

наблюдений.

Для

определения

значений теоретического распределения ста­

тистический ряд необходимо разделить на классы, а затем опреде­ лять вероятности совпадения случайных величин на участках между двумя классами. Эта вероятность находится по формуле

Pt {ßi-i < М < ß,} = Ф (ß,) - Ф (ß,-i),

где ф (ßt) — значение функции распределения, соответствующее высшей границе класса і; Ф (ß(—і) — значение функции распреде­

ления, соответствующее высшей границе

предшествующего

класса

і — 1.

численных значений функций

распределений ф

(ß,) и

Для

Ф (ßi—і)

разработаны специальные таблицы. Численные значения

эмпирического распределения определяются следующим отноше­ нием:

где с,- — число наблюдений, появляющихся в і классе.

По формуле (2.30) определяется численное значение X2, а затем по числу степеней свободы из специальной таблицы находится веро­ ятность близости эмпирической кривой распределения к нормаль­ ному закону распределения. Итак, при помощи критерия Пирсона оценивается степень согласованности эмпирического закона распре­ деления с нормальным законом распределения.

Из изложенного выше очевидно, что исследование случайных величин, описывающих некоторые случайные процессы и определе­ ние законов их распределения, требует выполнения большого коли­ чества вычислительных работ, чего нельзя осуществить без при­ влечения современных электронных вычислительных машин.

60

Соседние файлы в папке книги из ГПНТБ