Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Medicinskaja_statistika

.pdf
Скачиваний:
36
Добавлен:
25.03.2015
Размер:
391.79 Кб
Скачать

В научных исследованиях и клинической практике с целью сравнения двух средних величин или показателей (например, для выявления преимуществ одного метода лечения перед другим, сопоставления результатов исследования в контрольной и экспериментальной группах, сравнения показателей здоровья двух групп населения и т.п.) возникает необходимость не только определить их разность, но и оценить ее достоверность.

Разность между двумя средними или относительными величинами (показателями), каждая из которых имеет свою ошибку, также имеет свою ошибку.

Средняя ошибка разности ( mразн ) вычисляется по формуле:

mразн = ± Ö m12 + m22 , где m1 и m2 - средние ошибки сравниваемых величин

Т.о., ошибка разности равняется корню квадратному из суммы квадратов

ошибок сравниваемых величин.

Мерой достоверности разности двух величин является критерий досто-

верности ( критерий Стьюдента - t ):

для средних величин

для относительных величин

M1 M2

m12 + m22

P P

1 2

m12 + m22

где t - критерий достоверности

M1 и M2 - сравниваемые средние р1 и р2 - сравниваемые показатели m12 и m22 - их ошибки

Для медико-биологических исследований принято считать, что если критерий достоверности t ³ 2, то различие двух величин (средних или относительных) следует считать существенным, достоверным, доказанным с вероятностью в 95%. Если t < 2 , то различие величин не доказано.

ПРИМЕР. Требуется определить достоверность разности показателей (средний бал успеваемости) студентов медицинского института. На лечебном факультете средний балл составил

3,86 ± 0,04 , на педиатрическом - 4,03 ± 0,04.

 

M

1 - M2

 

4,03 - 3,86

 

0,17

 

 

 

Ö 0,042 + 0,042

 

t = ± Ö m12 + m22

=

= Ö 0,0032 = 3,0

Таким образом, в данном случае различие между средними величинами следует считать статистически достоверным.

СПЕЦИАЛЬНЫЕ СТАТИСТИЧЕСКИЕ МЕТОДИКИ

30

МЕТОД СТАНДАРТИЗАЦИИ

Общие показатели интенсивности, полученные на 4 этапе статистического исследования при статистическом анализе, не всегда правильно выявляют закономерности изучаемых явлений, так как на их уровень может влиять различие состава сравниваемых совокупностей , в отношении которых эти показатели рассчитаны . При сравнении показателей, характеризующих то или иное явление (заболеваемость, рождаемость, летальность и т .д) их различия могут определяться не только разным уровнем распространенности этих явлений, но и неоднородностью состава сравниваемых совокупностей . Эта неоднородность может быть обусловлена различным возрастным, половым, профессиональным или другим составом совокупностей.

Так, например , при изучении заболеваемости в двух изучаемых коллектива, необходимо учитывать их возрастно-половую структуру.

Статистический метод, при котором можно устранить влияние на результаты исследования различий сравниваемых совокупностей , неоднородных по своему составу, называется методом стандартизации.

Сущность этого метода заключается в том, что сравниваемые явления ис-

кусственно ставятся в одинаковые условия относительно группового распределения среды, т.е. совокупности, которые характеризуют анализируе-

мые показатели, условно считают одинаковыми.

Результатом проведения этого метода является вычисление стандартизованных показателей. Эти показатели, при сопоставлении их с обычными интенсивными показателями, позволяют сделать вывод, связаны ли различия в интенсивных показателях с неоднородностью составов сравниваемых совокупностей.

Стандартизованные показатели являются условными и не отражают истинных размеров изучаемого явления. Они применяются только для сравне-

ния и анализа данной ситуации вследствие того, что рассчитаны они при искусственно созданных условиях и не отражают действительного размера явлений.

Существует три метода расчета стандартизованных показателей: прямой, косвенный и обратный косвенному.

При проведении медицинских исследований обычно пользуются прямым методом стандартизации, который состоит из трех этапов.

1. Вычисление погрупповых показателей, т.е. ” истинныхили обычных относительных величин, характеризующих изучаемое явление в двух сравниваемых совокупностях. В зависимости от характера исследования это могут быть показатели заболеваемости, инфицированности, травматизма, смертности, и т.д., рассчитанные по группам (по диагнозам, тяжести заболевания, полу, возрасту, месту жительства и т.д.)

2.Вычисление стандарта, т.е. нового искусственного распределения среды

вопределенном масштабе. За масштаб стандарта берется основание (коэффи-

циент), на который рассчитывались показатели на первом этапе:

100,1000,10000 и т.д.

3. Вычисление стандартизованных показателей.

31

ПРИМЕР: Необходимо проанализировать заболеваемость с временной утратой трудоспособности в зависимости от возраста в двух цехах, рассчитав показатели обычным путем и применив метод стандартизации.

 

 

 

 

 

Таблица 1

 

 

 

Цех № 1

 

 

 

Цех № 2

 

Возраст

Число

Число слу-

Число забо-

Число

 

Число слу-

Число забо-

в годах

рабочих

чаев заболе-

леваний на

рабочих

 

чаев заболе-

леваний на

 

 

ваний

100 рабочих

 

 

ваний

100 рабочих

До 20

120

80

67,0

200

 

140

70,0

20 -39

380

400

105,3

500

 

575

115,0

40-59

400

680

170,0

80

 

132

165,0

60 и стар-

100

185

185,0

20

 

34

170,0

ше

 

 

 

 

 

 

 

Всего

1000

1345

134,5

800

 

881

110,0

Показатели заболеваемости рассчитываются по методике вычисления интенсив-

ных показателей:

 

 

 

 

 

явление

х 100

 

 

 

среда

 

 

Для цеха № 1: 1345 х 100

 

Для цеха № 2:

881 х 100

 

1000

= 134,5

 

800

= 110,0

Значительная разница в уровнях показателей предположительно связана с неоднородным возрастным составом работающих в этих двух цехах, но окончательные выводы можно сделать лишь после вычисления стандартизованных показателей.

1 этап стандартизации - вычисление показателей заболеваемости по воз-

растным группам. Эти показатели также как и общие являются показателями интенсивности рассчитываются по обычной для них методике. Так, для возрастной группы до 20 лет в цехе № 1 показатель заболеваемости будет вычисляться следующим образом:

80 х 100

120 = 67,0

Аналогично вычисляются показатели для каждой возрастной группы в каждом цехе. Результаты вычислений представлены в таблице № 1.

Вычисленные повозрастные показатели характеризуют увеличение уровня заболеваемости с возрастом, причем эта закономерность отмечается в цехе №1 и цехе № 2. Но так как сравнение повозрастных показателей в этих цехах не дает возможности определить преобладание уровня заболеваемости в какомлибо одном из них, необходимо продолжить стандартизацию показателей заболеваемости.

2 этап - вычисление стандарта. За стандарт принимаем повозрастной состав рабочих в обоих цехах, суммируя количество работающих в одной возрастной группе.

Общая численность коллектива, взятого за стандарт, берется равной основанию, в отношении которого выражены показатели на 1 этапе, т.е. 100. Следовательно за стандарт принимается распределение по возрасту 100 человек Расчеты по второму этапу представлены в таблице № 2.

32

 

 

 

 

Таблица 2

Возраст

Число работающих

Число рабо-

Стандарт (повозрастной

 

 

 

тающих в

состав работающих в обоих

 

 

 

обоих цехах

цехах в процентах)

 

цех №1

цех№2

 

 

до 20

120

200

320

18

20-39

380

500

880

49

40-59

400

80

480

26

60 и старше

200

20

120

7

Всего

1000

800

1800

100

Стандарт для каждой возрастной группы рассчитывается по методике вычисления показателей экстенсивности:

часть явления х100 целое явление

Зная, что целое явление - это число работающих в обоих цехах, а часть явления - количество работающих в каждой возрастной групп, вычисляем, например, стандарт для возрастной группы до 20 лет:

320 х100 %

 

1800

= 18 %

Аналогичным образом вычисляют стандарт для каждой возрастной группы работающих в двух цехах.

3 этап - вычисление стандартизованных показателей

Примем условно, что распределение работающих в обоих цехах по возрастам одинаково и соответствует стандарту, и рассчитаем ожидаемое количество заболеваний при новом, условном распределении работающих по возрастам.

 

 

 

 

 

Таблица 3

 

Возраст

Заболеваемость на 100 рабо-

Стандарт

Число заболеваний в стан-

 

 

тающих

 

дарте

 

до 20

67,0

 

70,0

18

12,0

 

12,6

20-39

105,3

 

115,3

49

51,6

 

56,3

40-59

170,0

 

165,0

26

44,2

 

42,9

60 и старше

185,0

 

170,0

7

12,9

 

11,9

Всего

134,5

 

110,0

100

120,7

 

123,7

В графах 2 и 3 представлены показатели заболеваемости по двум цехам, вычисленные на 1 этапе. В графе 4 - стандарт повозрастного состава работающих, вычисленный на втором этапе. данные граф 5 и 6 получают следующим образом: в возрасте до 20 лет в цехе № 1 показатель заболеваемости на 100 работающих -67,0, а в цехе №2 - 70,0. Следовательно, среди 18 работающих (по стандарту) заболеваний будет:

в цехе №1

67,0

х 18

 

 

100

= 12,0

в цехе №2

70 х

18

 

 

100

= 12,6

33

По такой же методике вычисляют числа других строк в двух последних графах (учитывая повозрастные показатели заболеваемости и стандарт). Сложив числа промежуточных стандартизованных показателей по возрастам в графах 5 и 6, получим стандартизованные показатели на 100 работающих для каждого цеха.

По результатам стандартизации можно сделать вывод: если бы возрастной

состав работающих в двух цехах был бы одинаков, то в цехе № 2 показатели заболеваемости были бы выше, чем в цехе № 1 ( 123,7 и 120,7 соответственно). Следовательно, более высокий уровень заболеваемости в цехе № 1 объясняется неблагоприятным составом рабочих по возрасту.

МЕТОД КОРРЕЛЯЦИИ

Различают два типа связи между явлениями: функциональную и корреляционную связь.

Функциональная связь предполагает строгую зависимость между явления-

ми. Это такой вид соотношения между двумя признаками, когда каждому

значению одного из них соответствует строго определенное значение друго-

го. Такой вид связи характерен для точных наук. Примером ее могут служить скорость движения и время пребывания в пути, радиус круга и длина окружности и т.п.

Между явлениями в медицине и биологии наблюдается корреляционная связь, то есть такая связь, при которой значению каждой величины одного

признака соответствует несколько значений другого взаимосвязанного с ним признака. На характер и величину этой связи влияют различные условия и обстоятельства.

Примерами корреляционной связи могут быть: связь между ростом и массой тела, связь между температурой тела и частотой пульса, между частотой послеоперационных осложнений и сроками проведения операций при острых заболеваниях органов брюшной полости, связь между заболеваемостью дифтерией и степенью охвата профилактическими прививками.

Наличие, величину и характер связи между явлениями можно установить с помощью статистического метода - метода корреляции.

Практическое значение установления корреляционной связи:

*выявление причинно-следственной связи между факторными и резуль-

тативными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состоянием здоровья, при определении зависимости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и пр.)

*выявление зависимости параллельных изменений нескольких признаков от какой-то третьей величины (например, под воздействием высокой температуры в цехе происходит изменение кровяного давления, вязкости крови, частоты пульса и пр.).

По направлению связь между явлениями может быть прямой (положитель-

ной), когда с увеличением или уменьшением одного явления соответственно увеличивается или уменьшается другое явление (например, с увеличением воз-

раста увеличивается количество пораженных кариесом зубов в расчете на одного

34

обследованного, с увеличением экспозиции между началом острого процесса в брюшной полости и проведением операции увеличивается число осложнений и летальность) и обратной (отрицательной), когда с увеличением одного явления

другое явление уменьшается или наоборот с уменьшением одного явления другое соответственно увеличивается (например, с увеличением возраста ре-

бенка уменьшается количество молочных зубов, с уменьшением содержания йода в воде и пище увеличивается число заболеваний щитовидной железы и т.д.).

По силе корреляционная связь может быть:

*сильной

*средней

*слабой

Величина, которая одним числом характеризует направление и силу связи между признаками, называется коэффициентом корреляции ( ρ ). Пределы колебаний коэффициента корреляции от 0 до ± 1.

Оценка размеров коэффициента корреляции

Оценка размеров корре-

Величина коэффициента корреляции

ляции (сила связи)

 

 

 

прямая связь ( + )

обратная связь ( - )

Связь отсутствует

0

0

Слабая (малая, низкая)

от 0 до 0,3

от 0 до - 0,3

Средняя (умеренная)

от 0,3 до 0,7

от - 0,3 до -0,7

Сильная (большая, высо-

от 0,7 до 1

от - 0,7 до 1

кая)

 

 

Методические требования к вычислению коэффициента корреляции:

*измерение связи возможно только в качественно однородных совокуп-

ностях (например, измерение связи между ростом и массой тела в совокупностях, однородных по возрасту и полу)

*расчет может производиться как на абсолютных, так и на производ-

ных величинах (относительных и средних)

*для вычисления коэффициента корреляции используются только несгруппированные данные

*число наблюдений должно быть менее 30.

Существует два метода определения коэффициента корреляции:

1.Метод квадратов (Пирсона) используется в тех случаях, когда требуется точное установление силы связи между признаками и когда признаки имеют только количественное выражение.

2.Ранговый метод (Спирмена) является наиболее простым способом определения коэффициента корреляции. Его применяют тогда, когда нет необходимости в точном установлении силы связи, а достаточно ориентировочных данных.

Основным принципом метода ранговой корреляции является сопоставление порядковых номеров (рангов) величин, характеризующих сравниваемые явления.

35

ПРИМЕР: Необходимо измерить величину и характер связи между заболеваемостью острыми респираторными инфекциями и заболеваемостью пневмонией , по данным семи районов.

Корреляция методом рангов между заболеваемостью острыми респираторными инфекциями и пневмонией

Заболеваемость

Заболеваемость

Ранговые номера по уров-

Разность

Квадрат

ОРЗ на 1000 на-

пневмонией на

ню заболеваемости

между ран-

разности

селения

1000 населения

 

 

гами (d )

рангов (d2 )

 

 

ОРЗ

Пневмония

 

 

352

64

1

1

0

0

228

60

6

2

4

16

340

52

2

3

1

1

300

48

3

4

1

1

196

46

7

5

2

4

258

41

4

6

2

4

237

32

5

7

2

4

 

 

 

 

 

Σd2 = 30

В графах 1 и 2 представлены исходные данные о заболеваемости острыми респираторными инфекциями и пневмонией по семи районам. В графах 3 и 4 указаны порядковые номера (ранги) уровней заболеваемости ОРЗ (графа 3) и пневмонией ( графа 4), причем порядковые номера в этих графах расположены по убыванию величин изучаемых явлений. Так, наибольший уровень заболеваемости ОРЗ - 352, ему соответствует порядковый номер 1, затем в порядке убывания стоит уровень заболеваемости - 340, ему соответствует порядковый номер 2, долее 300 - 3, 258 - 4, 237 - 5, 228 -6, 196 -7.По аналогичной системе располагаются ранговые номера, соответствующие различному уровню заболеваемости пневмони-

ей: 64-1, 60-2, 52- 3, 48 - 4 ,46-5 ,41-6, 32-7.

В графе 5 представлена разность между порядковыми номерами соответствующих величин в обоих рядах (d). Для первой строки: 1-1=0, для второй строки 6-2=4 и т.д. Затем эта разность возводится в квадрат и полученные числа записываются в графу 6, после чего они суммируются ( Σd2 = 30).

Коэффициент корреляции рангов вычисляется по формуле:

ρ = 1 −

6d 2

n(n2

− 1)

 

где ρ - коэффициент корреляции

n - число парных членов коррелируемых рядов (в нашем примере их 7) d - разность между рангами

d2 - квадрат разности рангов

6 - константа, предусмотренная методикой вычисления по данной форм

Σ- знак суммирования

Внашем примере коэффициент корреляции ( 0,47) означает, что между заболеваемостью острыми респираторными заболеваниями и заболеваемостью пневмонией существует прямая, средней тесноты связь.

36

Достоверность коэффициента корреляции рангов определяется его сред-

ней ошибкой (mρ) , которая определяется по формуле:

m = 1 - ρ2

ρ

n - 1

 

Коэффициент корреляции считается достоверным, если он в 3 раза и более превышает свою ошибку:

 

 

 

ρ

 

 

t =

m

> 3

 

 

1 - 0,472

 

Для нашего примера:

mρ =

Ö 7 - 1 = 0,28

В данном случае достоверность коэффициента корреляции недостаточно высокая, так как он (0,47) примерно в два раза превышает свою ошибку.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СТАТИСТИЧЕСКОЙ ОЦЕНКИ ЗНАЧИМОСТИ РАЗЛИЧИЙ

Одной из основных задач статистической обработки материала (лабораторных и клинических исследований ) является доказательство значимости различий между двумя или несколькими группами наблюдений, выявление силы и достоверности связи в изучаемых явлениях, определение степени влияния одних признаков на другие.

Вбольшинстве медицинских исследований для определения существенности различий двух сравниваемых групп наблюдений используют, главным образом, параметрический критерий t Стьюдента, который позволяет решить существенны или нет различия между двумя сравниваемыми выборками, получить четкий ответ на вопрос, принадлежат ли сравниваемые выборки к разным генеральным совокупностям или к одной. Однако, применение критерия t Стьюдента обосновано лишь в том случае, когда сравниваемые выборки имеют нормальное распределение. При нормальном распределении признака наибольшее количество частот изучаемого признака близко по размерам к средней величине ряда, а в обе стороны от этой варианты частоты постепенно уменьшаются.

Втех случаях, когда имеется малое число наблюдений и характер распределения неизвестен, когда кроме количественных характеристик результаты выражены полуколичественными, а иногда и описательными характеристиками, методы классической статистической обработки материалов, или так называемые параметрические методы, не всегда могут быть использованы.

Статистические методы, позволяющие обрабатывать и оценивать результаты наблюдений, выраженные как в строго количественной форме, так и в полуколичественном или качественном виде, без учета характера их распределения, объединяют в группу так называемых непараметрических статистических методов.

Название данных тестов связано с тем, что эти показатели не требуют вычисления параметров для характеристики частоты явления, для характеристики

37

среднего уровня признака, среднего квадратического отклонения, средней ошибки средней арифметической и показателя, необходимых при использовании параметрических критериев.

Основными преимуществами непараметрических критериев статистической оценки значимости различий являются: возможность обнаружить существенные различия при распределениях, отличающихся от нормального, в случаях, когда форма распределения неизвестна и перед оценкой значимости различий не проверялась; способность дать хорошие результаты при любом распределении, а также при малом числе наблюдений; высокая чувствительность, не уступающая критерию Стьюдента; возможность выявить различия в качественных изменениях, а также в форме распределений, при отсутствии различий в средних тенденциях; небольшая трудоемкость расчетов и сравнительная простота их.

Для характеристики одной совокупности или сравнения двух групп наблюдений применяются следующие основные непараметрические критерии:

Для характеристики одной совокупности может быть использован критерий проверки гипотезы о случайном характере флюктуаций, который дает воз-

можность решить, являются ли случайными или систематическими колебания результатов, полученных при проведении какого-либо исследования.

ПРИМЕР. При обследовании тщательно подобранной контрольной группы получены колебания показателей щелочной фосфатазы нейтрофилов (в процентах). Необходимо установить, случайны или нет эти флюктуации.

32, 44, 28, 32, 38, 31, 41, 31, 28, 24, 31, 30, 26, 27, 31,25, 27, 36, 29, 33, 38, 41, 35, 26, 29, 33, 37,

41, 40, 36.

Для решения поставленного вопроса с помощью критерия проверки гипотезы о случайном характере флюктуаций располагают варианты ряда в возрастающем порядке: 24, 25, 25, 26, 27,

27, 28, 28, 29, 29, 30, 31, 31, 32, 32, 33, 33, 35, 36, 36, 37, 38, 38, 40, 41, 41, 41, 44.

Находят медиану полученного ряда, которая равна полусумме 15ой и 16-ой вариант, т.к. число наблюдений составляет 30, т.е. (31+32)/2=31.5

Затем сравнивают медиану с исходными данными, расположенными в первоначальном порядке, при этом варианты большие , чем медиана, заменяют знаком +, меньшие заменяют знаком -. Если в ряду имеются варианты, равные медиане, их заменяют знаком + или – случайным способом. В результате получают:

+ + - + + - + - - - -

- - - - - -

+ - + + + -+ - + + + + +

1

2

3 4 5

6

7 8

9

10

Определяют и подсчитывают число серий одинаковых знаков (Р), в данном примере оно равно 11. Полученное число серий сравнивают с табличными. Если полученное число серий (Р) меньше, чем Р0.025 или больше, чем Р0.975, то нулевая гипотеза о случайном характере колебаний отвергается.

В приведенном примере, где число наблюдений равно 30, число серий, необходимых для признания колебаний случайными, согласно таблице составляет от 10 до 21. Следовательно, в приведенном примере колебания результатов исследования являются случайными и правильность подбора контрольной группы подтверждается еще одним тестом.

Верхние и нижние пределы общего числа серий (Р) для различного числа наблюдений

n

0.025

0,975

n

0,025

0,975

N

0,025

0,075

10

2

9

24

7

18

40

14

27

12

3

10

26

8

19

50

18

33

38

14

3

12

28

9

20

60

22

39

16

4

13

30

10

21

80

31

51

18

5

14

32

11

22

100

40

61

20

6

16

34

11

24

120

49

72

22

7

16

36

12

25

140

58

83

Для оценки различия двух связанных (сопряженных) совокупностей может быть использован критерий знаков.

Критерий знаков применяется при анализе экспериментальных и клинических данных, когда варианты двух или более сравниваемых совокупностей со-

пряжены между собой попарно. Сущность критерия знаков заключается в том, что оцениваются не сами количественные значения результатов, а только на-

правленность их изменения (увеличение, уменьшение, без изменения). Оценка ре-

зультатов проводится по специальным таблицам с заданной вероятностью Р. В таблицах приводятся значения того минимального числа наблюдений (опытов), в котором должно проявиться однозначное влияние исследуемого фактора из общего количества проведенных наблюдений. Нулевая гипотеза, т.е. предположение о том, что полученная в опыте разница случайна, принимается тогда, когда количество менее часто встречающихся знаков больше табличных критических чисел. Если же это число равно или меньше критического числа менее часто встречающихся знаков, то обнаруженные изменения признаются существенными.

ПРИМЕР. Оценка при помощи критерия знаков изменения количества лейкоцитов в 1 мкл. крови у 12 обследованных здоровых лиц до исследования, а также через ½ часа и через 1 час после перорального приема 70-80 мл. 0.5% раствора новокаина.

Обследован-

В контроле

Через ½часа

Разница (с

Через 1 час

Разница (с

ный

 

 

контролем)

 

контролем)

1

7600

6800

-

10200

+

2

8600

7400

-

1020

+

3

7600

9200

+

9200

+

4

8800

8200

-

1060

+

5

6000

6400

+

7800

+

6

6000

5800

-

7200

+

7

5200

5800

+

6600

+

8

10600

10200

-

14400

+

9

5800

5600

-

8000

+

10

6800

8400

+

1020

+

11

1080

8000

-

1300

+

12

8600

7400

-

1210

+

Для оценки полученных результатов подсчитывают число наблюдений, в которых наблюдался положительный (+) или отрицательный (-) эффект, определяют по таблице (Z) – минимальное число наблюдений с однозначным результатом, при котором можно с той или иной степенью вероятности утверждать о значимости происшедшего сдвига.

39

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]