Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
BIOSTATISTIKA_uchebnik_rus.docx
Скачиваний:
655
Добавлен:
19.03.2016
Размер:
2.07 Mб
Скачать

Доверительный интервал относительных показателей

Относительная частота р встречаемости того или иного признака – т.е. доля объектов с данным признаком среди всех обследуемых объектов, найденная по выборке объемом n отражает генеральную долю с некоторой ошибкой. Доверительный интервал для доли лежит в пределах

от до(24)

Доверительный интервал разности двух генеральных долей имеет следующее выражение

или (25)

где t – критическое значение двустороннего t-критерия Стъюдента для заданного α и (п1+ п2-1) степеней свободы.

Пример. Согласно выборочным исследованиям доля курящих среди женщин составляет 10%. Насколько точно определена эта доля, можно ли отнести эти данные на всю генеральную совокупность?

Таблица 27. Результаты статобработки

всего опрошено женщин

доля курящих

нижний предел

95% ДИ

верхний предел

95% ДИ

1020

10%

8,2%

11,8%

Доверительный интервал для доли неширокий, можно говорить о достаточной точности результатов: с вероятностью 95% доля курящих в генеральной совокупности женщин составляет от 8,2% до 11,8%

Пример. Выборочные исследования показали, что доля инфекционных заболеваний в общей структуре заболеваемости в одном регионе составляет 20%, в другом – 37%, с разницей в 17%. Необходимо проверить, действительно ли эта разница существует, или она носит случайный характер, и насколько эти результаты существенны с точки зрения общественного здравоохранения.

Таблица 28. Данные к примеру

регион

всего больных

доля инфекц.

заболеваний

разность

долей

нижний предел

95% ДИ

верхний предел

95% ДИ

1 регион

520

20%

-17%

-22,8%

-11,2%

2 регион

400

37%

Т.к. доверительный интервал не содержит ноль, то с вероятностью 95% можно утверждать, что различия в заболеваемости не случайны. И нижний и верхний пределы указывают и на клиническую значимость этих результатов.

Контрольное задание 7:

1000 человек классифицировали по признаку дальтонизма. По приведенным в таблице 29 данным используя понятие доверительного интервала проверить, есть ли зависимость между наличием дальтонизма и полом человека, при α = 0,05. Сформулируйте нулевую и альтернативную гипотезы.

Таблица 29. Данные к заданию

Мужчины

Женщины

Дальтоники

38

6

Не дальтоники

442

514


Непараметрические критерии проверки статистических гипотез

Проблема. При испытании нового лекарственного препарата на лабораторных мышах было проведено взвешивание после месячного приема. В эксперименте изучались две группы мышей: опытная (n1=9), которой давали новый препарат и контрольная, принимавшая плацебо (n2=11).

Были получены следующие данные по весу (г)

Таблица 30. Вес мышей

Опытная гр.

80

76

75

64

70

68

72

79

83

Контрольная гр.

70

78

60

80

62

68

73

60

71

66

69

Необходимо определить, влияет ли новый препарат на привес животных.

Так как эти данные выборочные, то для выяснения этого вопроса можно было бы найти средние значения веса и сравнить по критерию Стъюдента. Но, вспомним, что основным условием применения t – критерия является нормальное распределение признака. В нашем случае распределение веса неизвестно и проверить его нельзя из-за ограниченности объема выборки.

Еще один проблемный случай. Как правило, имеющийся дефицит гемодиализной помощи не позволяет уделять должного внимания проблеме лечения терминальной хронической почечной недостаточности у пожилых лиц. Для выяснения действительно ли существует такая проблема, было решено сравнить возрастной состав лиц, лечившихся гемодиализом в странах с развитой экономикой и развивающихся странах. Случайным образом были сформированы выборки таких больных (n1=7, n2=8) в двух странах с различным уровнем развития, и определен возрастной состав.

Таблица 31. Возрастной состав

1 страна

Юноша

(Ю)

Подросток

(ПД)

Пожилой

(ПЖ)

Взрослый

(В)

Юноша

(Ю)

Взрослый

(В)

Ребенок

(Р)

2 страна

Ребенок

(Р)

Ребенок

(Р)

Юноша

(Ю)

Взрослый

(В)

Пожилой

(ПЖ)

Взрослый

(В)

Пожилой

(ПЖ)

Ребенок

(Р)

Исследуемый признак – возраст - является качественным ординальным, для него нельзя вычислить ни среднее значение, ни дисперсию, нельзя определить распределение.

В случае если распределение случайной величины неизвестно, а также если изучаемые признаки являются качественными ординальными, то для проверки гипотезы о принадлежности двух сравниваемых выборок одной генеральной совокупности может применяться и целый ряд непараметрических критериев, среди которых важное место занимают так называемые ранговые критерии. Применение этих критериев основано на ранжировании членов сравниваемых групп. При этом сравниваются не сами члены ранжированного ряда, а их порядковые номера или ранги.

Вспомним, что выбор критерия определяется также тем, являются ли сравниваемые выборки зависимыми или независимыми.

СЛУЧАЙ 1. Выборки независимы.

Весьма распространенным непараметрическим критерием является U-критерий Манна-Уитни. Рассмотрим расчет этого критерия на примере второго проблемного случая.

Сформулируем гипотезы:

Н(0): Возрастной состав лиц, получающих лечение гемодиализом, не зависит от уровня экономического развития страны

Н(1): Возрастной состав лиц, получающих лечение гемодиализом, не одинаков в странах с различным экономическим уровнем (ненаправленная гипотеза)

Выберем уровень значимости α=0,01

Вычислим значение U-критерия по следующему алгоритму

  • Объединим все значения обеих выборок в один ранжированный ряд

Таблица 32. Порядок расстановки рангов

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

1гр

Р

ПД

Ю

Ю

В

В

ПЖ

2гр

Р

Р

Р

Ю

В

В

ПЖ

ПЖ

ранг

2,5

2,5

2,5

2,5

5

7

7

7

10,5

10,5

10,5

10,5

14

14

14

  • Каждому элементу этого ряда присвоим ранг, при этом, если несколько элементов ряда совпадают по величине, то каждому присваивается ранг, равный среднему арифметическому их номеров

  • Для каждой выборки находятся суммы рангов

R1 = 2,5+5+7+7+10,5+10,5+14=56,5

R2 =2,5+2,5+2,5+7+10,5+10,5+14+14=63,5

  • Рассчитываются статистики:

(26)

где i=1,2 номера выборок

U1 = 56,5 - 7 * 8/2 =28,5

U2= 63,5 -8*9/2 = 27,5

Для проверки правильности расчетов можно использовать следующее соотношение

(27)

(28)

В качестве критерия выбираем наименьшую из двух сумм Uвыч = 27,5 и сравниваем ее с табличным значением для nl =7, n2 = 8 и уровня значимости α=0,01 Uкрит = 6 (Приложение 3, двусторонний тест).

  • Если Uвыч > Uкрит то принимается Н(0)

  • Если UвычUкрит то принимается Н(1)

В нашей задаче вычисленное значение критерия больше табличного, поэтому принимается нулевая гипотеза, и различия в возрастном составе между группами считаются статистически незначимыми (нет аргументов отвергнуть нулевую гипотезу).

Но окончательно принять нулевую гипотезу мы пока еще не можем, возможно, мы обнаружим различия, если увеличим объем выборки и применим параметрический критерий. Но этот вопрос относится уже к проблемам планирования эксперимента.

СЛУЧАЙ 2. Выборки зависимы.

Проблема. Необходимо определить влияет ли новый препарат на содержание холестерина в плазме крови. С этой целью препарат был испытан на десяти кроликах. В результате получены следующие данные

Таблица 33. Экспериментальные данные по холестерину

Концентрация холестерина

«До», ммоль/л

6,3

7

6,8

5,6

4,8

7,2

6,2

5

8,1

7,9

«После», ммоль/л

4,8

4,6

3,3

5,6

6,3

5,1

4,7

6,3

5,5

6,2

Исследуемый признак количественный, закон распределения для которого неизвестен и его нельзя оценить вследствие малой выборки, а выборки являются зависимыми (попарно связанными). В таком случае можно использовать непараметрический Т-критерий Уилкоксона.

Выдвигаем гипотезы:

Н(0): В генеральной совокупности содержание холестерина в плазме крови после приема препарата не изменяется, или «препарат не влияет на содержание холестерина в плазме крови», или «две выборки извлечены из одной генеральной совокупности»

Н(1): В генеральной совокупности содержание холестерина в плазме крови после приема препарата изменяется (ненаправленная гипотеза)-

Выберем уровень значимости α = 0,05

Т-критерий Уилкоксона вычисляется по следующему алгоритму

  • Вычисляются попарные разницы значений «до» и «после» (таблица 34)

Таблица 34. Алгоритм расчета критерия

Концентрация холестерина

«До», ммоль/л

6,3

7

6,8

5,6

4,8

7,2

6,2

5

8,1

7,9

«После», ммоль/л

4,8

4,6

3,3

5,6

6,3

5,1

4,7

6,3

5,5

6,2

Разница, ммоль/л

1,5

2,4

3,5

0

-1,5

2,1

1,5

-1,3

2,6

1,7

Ранжир. ряд

0

-1,3

-1,4

1,5

-1,5

1,5

1,7

2,4

2,6

3,5

Ранги

1

2

3

3

3

4

5

6

7

Т+

28

Т-

6

  • Попарные разницы, кроме нулевых, без учета знака ранжируются в один ряд

  • Разницам, кроме нулевых, присваиваются ранги, при чем одинаковым по модулю величинам присваивают одинаковый ранг

  • Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных разностей (Т-),

Т+ = 3+3+4+5+6+7=28

Т- = 1+2+3=6

  • Меньшую из двух таких сумм без учета знака выбирают в качестве критерия:

Твыч = 6

Табличное значение для уровня значимости α = 0,05 и числа пар наблюдений п=10 (двусторонний критерий, Приложение 4):

Ткрит = 9

  • Если Твыч > Ткрит то Н(0)

  • Если Твыч ≤ Ткрит то Н(1)

В нашем случае вычисленное значение критерия меньше табличного и принимается альтернативная гипотеза.

Вывод: Содержание холестерина в плазме крови после приема препарата изменяется с вероятностью не менее 95%.

Контрольное задание 8:

Исследовалось влияние нервно-эмоциональной нагрузки (тест «реакция на движущийся объект») на частоту пульса у 15 испытуемых. Сформулируйте нулевую и альтернативную гипотезы. Какой критерий можно использовать для проверки этих гипотез, если статистическое распределение ЧП неизвестно. Сделайте выводы по данной задаче, если вычисленное значение критерия равно 2, а α=0,01. Обоснуйте каждый свой ответ.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]