Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Tom_1_Obschestvennoe_zdorovye_Kucherenko

.pdf
Скачиваний:
7344
Добавлен:
22.03.2016
Размер:
8.35 Mб
Скачать

84 Часть I. Общественное здоровье и здравоохранение

При использовании современных программных средств расчет производят по формуле:

nxy – ∑x × ∑y

rxy = ([∑x2 – /∑x2/][ny2 – /∑y2/]) .

Метод ранговой корреляции (Спирмена) применяют в случаях, когда:

нет необходимости в точном установлении силы связи, а достаточно ориентировочных данных;

признаки представлены не только количественными, но и атрибутивными значениями;

ряды распределения признаков имеют открытые варианты (например, стаж работы свыше 10 лет и др.).

Методика вычисления коэффициента ранговой корреляции.

1.Из парных сопоставляемых признаков необходимо составить два ряда, обозначив их соответственно х и y. При этом первый ряд признака представляют в убывающем либо возрастающем порядке,

ачисловые значения второго ряда располагают напротив того значения первого ряда, которым они соответствуют.

2.Величину признака в каждом из сравниваемых рядов заменяют порядковым номером (рангом). При этом числовым значениям второго признака ранги должны присваивать в том же порядке, какой был принят при определении рангов величинам первого признака. При одинаковых величинах признака в ряду ранги следует определять как среднее количество из суммы порядковых номеров этих величин.

3.Определяют разность рангов (d) между х и y (d=хy).

4.Полученную разность рангов возводят в квадрат (d2) и суммируют (Σd2).

5.Ранговый коэффициент корреляции рассчитывают по формуле:

6∑d2 ρxy = 1 – n (n2 – 1) .

Помимо определения силы и направления связи необходимо:

убедиться в том, что коэффициент корреляции, вычисленный по данным выборочного исследования, будет соответствовать размеру связи в генеральной совокупности;

Глава 2. Основные статистические методы обработки результатов...

85

определить среднюю ошибку коэффициента корреляции (mrxy или mρx)y и критерий t.

Оценку достоверности коэффициента корреляции, полученного методами квадратов (mrxy) и ранговой корреляции (mρx)y, определяют двумя способами.

Способ 1.

Достоверность определяют по формуле соответственно методу:

t = rxy / mrxy или t = pxy / mpxy

Ошибку коэффициента корреляции рассчитывают по формуле:

 

 

1 – r

2

 

 

1 – ρ

2

mrxy =

 

xy

 

или mρxy =

xy

n – 2

n – 2

 

 

 

 

 

 

 

Критерий t оценивают по таблице значений t (таблице Плохинского Н.А., Приложение 2) с учетом количества степеней свободы (n – 2), где n — количество парных вариант. Критерий t должен быть равен или больше табличного, соответствующего вероятности безошибочного прогноза (р ≥99%).

Способ 2.

Достоверность оценивают по специальной таблице стандартных коэффициентов корреляции. При этом достоверным считают такой коэффициент корреляции, когда при определенном количестве степеней свободы (n – 2) он равен или больше табличного, соответствующего степени безошибочного прогноза (р ≥95%).

Определение зависимости между факторными и результативными признаками с использованием метода Пирсона

Пример. В городе К отмечают высокую частоту возникновения желудочно-кишечных заболеваний у детей первого года жизни. Известно, что значительное количество матерей рано отказываются от грудного вскармливания и вводят прикорм (табл. 2-10).

Задание. Определить зависимость частоты возникновения желу- дочно-кишечных заболеваний у детей первого года жизни от частоты раннего прикорма и искусственного вскармливания.

86 Часть I. Общественное здоровье и здравоохранение

Таблица 2-10. Влияние введения раннего прикорма и искусственного вскарм-

ливания на частоту

возникновения желудочно-кишечных заболеваний

у детей первого года жизни

 

 

 

 

 

Микрорайоны

 

Частота возникновения

Частота раннего

города

 

желудочно-кишечных

прикорма и искусствен-

 

 

заболеваний

ного вскармливания

А

 

21

14

Б

 

23

16

В

 

27

18

Г

 

26

20

Д

 

29

22

 

 

 

 

Обоснование выбора метода. Для решения задачи выбран метод квадратов (Пирсона), так как каждый из признаков (частота возникновения желудочно-кишечных заболеваний у детей первого года жизни и частота раннего прикорма и искусственного вскармливания) имеет числовое выражение. Нет открытых вариантов.

Решение. Последовательность расчетов изложена в тексте, результаты представлены в табл. 2-11. Построив ряды из парных сопоставляемых признаков, обозначают их через х (частота возникновения желудочно-кишечных заболеваний на 1000 детей) и через y (частота раннего прикорма и искусственного вскармливания на 1000 детей).

Таблица 2-11. Пример расчета влияния введения раннего прикорма и искусственного вскармливания на частоту желудочно-кишечных заболеваний у детей первого года жизни (метод Пирсона)

Частота возник-

Частота раннего

dx

dy

dx×dy

dx2

dy2

новения желу-

прикорма

 

 

 

 

 

 

 

дочно-кишечных

и искусственного

 

 

 

 

 

 

 

заболеваний

вскармливания

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

 

14

–2,8

–4,0

 

11,2

7,84

16,0

 

 

 

 

 

 

 

 

 

25

 

16

–1,8

–2,0

 

3,6

3,24

4,0

 

 

 

 

 

 

 

 

 

 

27

 

18

+0,2

0

 

 

0

0,04

0

 

 

 

 

 

 

 

 

 

28

 

20

+1,2

+2,0

 

2,4

1,44

4,0

 

 

 

 

 

 

 

 

30

 

22

+3,2

+4,0

12,8

10,24

16,0

 

 

 

 

 

 

 

 

 

 

χ =Σx/n

χ

=Σу/n

Σ(d

x

× d )=

Σd 2=

Σd 2=

x

у

 

 

 

 

y

x

y

 

 

 

 

 

=30,0

=22,8

=40,0

 

 

 

 

 

 

 

 

 

χx=134/5=26,8

χу =90/5=18

 

 

 

 

 

 

Глава 2. Основные статистические методы обработки результатов...

87

rxy =

 

∑ (dx

× dy)

30

 

30

 

 

30

 

 

 

 

 

=

 

 

=

 

 

 

=

 

=+0,993.

 

 

 

 

 

 

 

 

 

 

 

(∑ d2x ×∑ d2y)

(22,8 × 40,0)

912

30,2

 

 

Определить достоверность коэффициента корреляции можно двумя способами.

Способ 1. Найти ошибку коэффициента корреляции (mrxy) и кри-

терий t по формулам:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mrxy = ±

1 – 0,9932

 

= ±

0,014

 

 

 

 

=

0,005

= ±0,07;

5 – 2

3

 

 

 

 

 

 

 

 

 

t = 0,993/0,07 = 14,2.

Критерий t = 14,2, что больше tтабл. = 12,9 в таблице Н.А. Плохинского (приложение 2) при количестве степеней свободы (n – 2). В этом

примере n = 5 – 2 = 3 и соответствует вероятности безошибочного прогноза р >99,9%.

Способ 2. Достоверность коэффициента корреляции оценивают по таблице «Стандартные коэффициенты корреляции» (приложение 3). При количестве степеней свободы (n – 2) = 5 – 2 = 3 расчетный коэффициент корреляции (rxy = +0,993) больше табличного (rтабл. = +0,959 при р = 99%).

Вывод. Связь прямая, сильная и достоверная: rxy = +0,993, р >99,9%, т.е. чем больше частота раннего прикорма и искусственного вскармливания детей первого года жизни, тем больше у них частота возникновения желудочно-кишечных заболеваний.

Определение зависимости между факторными и результативными признаками с использованием метода Спирмена

Пример. При изучении состояния здоровья школьников было установлено снижение зрительных функций подростков в возрасте 11–13 лет в зависимости от среднего времени непрерывной работы за компьютером в течение дня (табл. 2-12).

88 Часть I. Общественное здоровье и здравоохранение

Таблица 2-12. Влияние непрерывной работы за компьютером на снижение зрительных функций подростков в возрасте 11–13 лет

Среднее время непрерывной работы

Снижение зрительных функций

за компьютером, мин

у школьников (на 100 детей)

 

 

< 20

5

 

 

21–30

15

 

 

31–40

30

 

 

41–50

35

 

 

51–60

45

 

 

> 60

75

 

 

Задание. Определить у подростков в возрасте 11–13 лет зависимость снижения их зрительных функций от среднего времени непрерывной работы за компьютером в течение дня.

Обоснование выбора метода. Для решения задачи может быть выбран метод ранговой корреляции, так как первый ряд признака «среднее время непрерывной работы за компьютером» имеет открытые варианты (до 20 и свыше 60 мин), что не позволяет использовать для установления связи между сопоставляемыми признаками более точный метод — метод квадратов.

Решение. Последовательность расчетов изложена в тексте, результаты представлены в табл. 2-13.

Таблица 2-13. Пример расчета влияния непрерывной работы за компьютером на снижение зрительных функций подростков в возрасте 11–13 лет (метод Спирмена)

Среднее время

Снижение зри-

Порядковый

Разность

Квадрат

непрерывной

тельных функций

номер (ранг)

рангов

разности

работы за компью-

школьников

 

 

 

рангов

тером, мин

(на 100 детей)

 

 

 

 

х

у

d (xy)

d2

 

 

<20

5

1

1

0

0

 

 

 

 

 

 

21–30

15

2

2

0

0

 

 

 

 

 

 

31–40

30

3

3

0

0

 

 

 

 

 

 

41–50

35

4

4

0

0

 

 

 

 

 

 

51–60

45

5

5

0

0

 

 

 

 

 

 

>60

75

6

6

0

0

 

 

 

 

 

 

Σd2 = 0

Глава 2. Основные статистические методы обработки результатов...

89

ρxy = 1 –

6∑d2

6 × 0

0

0

 

 

= 1 –

 

= 1 –

 

= 1 –

 

= 1 – 0 = +1.

n (n2 – 1)

6 (62 – 1)

6 (36 – 1)

 

 

 

 

210

 

Определить ошибку (xy) коэффициента ранговой корреляции и оценить достоверность его с помощью критерия t можно по формуле:

 

1 – ρ

2

 

1 – 12

0

 

xy =

xy

=

 

=

 

= 0.

 

 

4

 

n – 2

 

 

6 – 2

 

Ошибка коэффициента равна нулю.

Вывод. Существует прямая, сильная, достоверная зависимость частоты снижения зрительных функций подростков в возрасте 11–13 лет от среднего времени их непрерывной работы за компьютером в течение дня, т.е. с увеличением времени непрерывной работы за компьютером частота снижения зрительных функций увеличивается.

Критерий соответствия — хи-квадрат (χ2)

С помощью χ2 (хи-квадрата) определяют соответствие (согласие) эмпирического распределения теоретическому и тем самым оценивают достоверность различий между выборочными совокупностями. Критерий применяют в тех случаях, когда нет необходимости знать величину того или иного параметра (среднюю или относительную) и требуется оценить достоверность различий не только двух групп, но и большего их количества.

Критерий соответствия применяют для статистической оценки результатов исследования в случаях, когда нет необходимости знать величину самого показателя, размер связи, а требуется лишь подтвердить:

существенно ли влияние изучаемого фактора или оно случайно;

наличие взаимосвязи между признаками.

Метод оценки достоверности по критерию Стьюдента позволяет проводить только попарное сопоставление групп. В отличие от него, критерий соответствия позволяет проводить сопоставление не только двух групп, но и большего их количества, в чем и состоит его преимущество. Определение критерия соответствия основано на довольно распространенном в исследованиях приеме — доказывать от противного.

В практическом здравоохранении метод χ2 можно широко использовать при оценке эффективности прививок, действия препаратов,

90

Часть I. Общественное здоровье и здравоохранение

результатов различных методов лечения и профилактики заболеваний, влияния условий труда и быта на заболеваемость работающих. С помощью критерия можно определить, влияют или нет сроки госпитализации на течение заболеваемости, материальное обеспечение населения — на уровень заболеваемости и т.д.

Критерий определяют по формуле:

 

(P P )2

 

χ2 = Σ

1

,

P1

 

 

где Р — фактические (эмпирические) данные; Р1 — ожидаемые (теоретические) данные, вычисленные на основании нулевой гипотезы; Σ — знак суммы.

Определение критерия основано на расчете разницы между фактическими и ожидаемыми данными. Чем больше эта разность (Р Р1), тем с большей вероятностью можно утверждать, что существуют различия в распределении сравниваемых выборочных совокупностей. И наоборот, чем меньше разность, тем меньше шансов на то, что сравниваемые выборочные совокупности различны между собой.

Пример. При изучении организации специализированной помощи больным ревматизмом были проанализированы сроки постановки им диагноза с момента обращения в поликлинику (менее 15 сут, 15 сут и более). В поликлинику № 1, где прием больных вел специалист в кардиоревматологическом кабинете, обратились 73 пациента и в поликлинику № 2, где специализированного кабинета не было (прием вел терапевт), — 21 пациент.

Задание. Определить, существенно ли различаются группы больных ревматизмом по срокам постановки диагноза с момента обращения в поликлинику в зависимости от наличия в ней кардиологического кабинета.

Решение (табл. 2-14).

Этап 1 — распределение фактических данных (Р) по всем группам, суммирование итогов (61 + 33 = 94).

Этап 2 — определение ожидаемых величин (Р1) на основе нулевой гипотезы. Согласно нулевой гипотезе допускают, что наличие или отсутствие в поликлинике кардиоревматологических кабинетов не влияет на сроки постановки диагноза у больных ревматизмом. В этом случае распределение двух групп больных, обслуживаемых с участием специалистов кардиоревма-

Глава 2. Основные статистические методы обработки результатов...

91

тологического кабинета и без него, по срокам постановки диагноза должно быть одинаковым и соответствовать итоговому фактическому распределению всех наблюдаемых больных, т.е. 61 и 33. При таком условии в первой группе (кардиоревматологический кабинет есть) ожидаемое количество больных со сроком установления диагноза менее 15 сут определяют по следующей пропорции:

94–61; 73–х; х = 47,4.

Ожидаемое количество больных со сроком установления диагноза 15 сут и более получают путем вычисления: 73 – 47,4 = 25,6. Подобным же образом рассчитывают ожидаемые количества больных второй группы. Полученные ожидаемые количества по всем группам заносят в таблицу.

• Этап 3 — определяют разность между фактическими и ожидаемыми числами (Р Р1). Первая группа больных: (Р Р1) =

=54 – 47,4 = +6,6; 19 – 25,6= 6,6. Вторая группа больных: (Р Р1) =

=7 – 13,6 = –6,6; 14 – 7,4 = +6,6. В числовом отношении разность

между фактическими и ожидаемыми числами (Р Р1) одинакова, что позволяет проверить правильность расчетов.

Этап 4 — определяют квадрат разности (P Р1)2 по всем группам.

Этап 5 — квадрат разности делят на ожидаемое число (P P1)2/P1 во всех группах, и результаты заносят в таблицу, например: 43,56/47,41 = 0,9 и т.д.

Этап 6 — критерий соответствия определяют путем суммирования предыдущих результатов (P P1)2/P1 по всем группам:

χ2 = Σ(P P1)2 / P1 = 0,9 + 1,7 + 3,2 + 5,9 = 11,7.

Таблица 2-14. Распределение больных ревматизмом по срокам установления диагноза в поликлиниках с разной системой организации специализированной помощи

Кардио-

Коли-

Этап 1

Этап 2

Этап 3

 

Этап 4

Этап 5

ревмато-

чество

 

 

 

 

 

 

 

 

 

 

 

<15

15

<15

15

<15

15

 

<15

15

<15

15

логиче-

боль-

 

сут

сут

сут

сут

сут

сут

 

сут

сут

сут

сут

ский

ных

 

 

 

 

 

 

 

 

 

 

 

 

кабинет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Есть

73

54

19

47,4

25,6

+6,6

–6,6

 

43,56

43,56

0,9

1,7

 

 

 

 

 

 

 

 

 

 

 

 

 

Нет

21

7

14

13,6

7,4

–6,6

+6,6

 

43,56

43,56

3,2

5,9

 

 

 

 

 

 

 

 

 

 

 

 

 

Всего

94

61

33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

92

Часть I. Общественное здоровье и здравоохранение

Величина критерия χ2 зависит от показателей разности между фактическими и ожидаемыми числами и слагаемых (то есть количества сравниваемых групп по графам и строкам). Чем больше разность, тем больше критерий. Если бы фактические данные были равны ожидаемым, то χ2 был бы равен нулю и нулевую гипотезу надо было бы признать существенной. И наоборот, чем больше величина критерия, тем нулевая гипотеза становится менее вероятной, несущественной.

Для оценки критерия учитывают количество рядов (R) и строк (S) распределения фактических чисел (без итоговых) и на основании этих данных вычисляют так называемое количество степеней свободы:

n = (R – 1) × (S – 1).

В данном примере R = 2, S = 2, при этом:

n = (2 – 1) × (2 – 1) = 1.

Количество степеней свободы указывает на количество свободно варьирующих элементов, или количество клеток таблицы, которые могут быть заполнены любыми количествами без изменения общих итоговых данных.

Полученную величину оценивают по специальной таблице. Для того чтобы опровергнуть нулевую гипотезу, вычисленный критерий соответствия должен быть равен табличному (критическому) значению χ2 или больше него при уровне вероятности нулевой гипотезы p = 5%.

Показатели взаимной сопряженности (четырехпольная таблица) представлены в табл. 2-15.

Таблица 2-15. Показатели взаимной сопряженности

Показатель

p2

q2

Всего

p1

a

c

a+c

q1

b

d

b+d

Всего

a+b

c+d

N

 

 

 

 

При альтернативном распределении применяют упрощенную формулу, которую рассчитывают на основе четырехпольной таблицы:

Глава 2. Основные статистические методы обработки результатов...

93

x2 =

(ad – bc)2n

 

 

,

 

 

 

(a+b) (c+d) (a+c) (b+d)

где p — частота встречаемости признака в одной (Р) и другой (Р1) группе; q — альтернативный показатель p; n — количество наблюдений; a, b, c, d — абсолютные величины в клетках таблицы.

Пример решения задачи по четырехпольной таблице.

1.Согласно нулевой гипотезе допускают, что наличие или отсутствие в поликлинике кардиоревматологических кабинетов не влияет на сроки постановки диагноза у больных ревматизмом.

2.Составляют четырехпольную таблицу.

Кардиоревматологический

Срок постановки

Срок постановки

Всего

кабинет

 

 

диагноза

 

 

 

диагноза

 

 

 

 

 

менее 15 сут (p)

15 сут и более (q)

 

 

 

 

 

 

 

 

 

 

 

 

Есть (p)

 

 

54 (a)

 

 

 

19 (c)

73

 

 

 

 

 

 

 

 

 

 

 

Нет (q)

 

 

7 (b)

 

 

 

14 (d)

21

 

 

 

 

 

 

 

 

 

 

 

Всего

 

 

61

 

 

33

94

 

 

 

 

 

 

 

 

 

 

 

 

x2 =

 

(ad – bc)2n

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

(a+b) (c+d) (a+c) (b+d)

 

=

 

(756 – 133)2×94

=

36 484 126

= 11,8.

 

 

 

 

 

3 085 929

 

(54+7) (19+14) (54+19) (7+14)

 

 

 

3. Оценивают количество степеней свободы. В данном примере имеется только одно количество степеней свободы: n = 1. Это указывает на то, что достаточно найти только одно ожидаемое количество, тогда три остальных количества можно легко получить как дополнение до итоговых чисел.

4.Полученную величину критерия при n = 1 оценивают по специальной таблице (см. приложение 2). Вычисленная величина: χ2 = 11,8 больше критического значения χ2, при котором уровень ее вероятности подтверждения нулевой гипотезы будет равен 0,1%. Это позволяет опровергнуть нулевую гипотезу и признать существенными различия

враспределении по срокам постановки диагноза двух сравниваемых групп (обследованных специалистом, работающим в кардиоревматологическом кабинете, и при отсутствии такого специалиста).

5.Следовательно, на основании проведенного исследования можно утверждать, что организация специализированных кардио-