Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Matematicheskaya_statistika_v_meditsine

.pdf
Скачиваний:
119
Добавлен:
19.02.2016
Размер:
5.63 Mб
Скачать

Министерство здравоохранения Республики Беларусь

УЧРЕЖДЕНИЕ ОБРАЗОВАНИЯ «ГРОДНЕНСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ»

Кафедра медицинской и биологической физики

А.В. Копыцкий Е.П. Наумюк

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В МЕДИЦИНЕ

Учебно-методическое пособие для студентов медико-психологического факультета

Гродно

ГрГМУ

2013

1

Копыцкий, А.В.

КМатематическая статистика в медицине : учебно-методическое пособие для

студентов медико-психологического факультета / А.В. Копыцкий, Е.П. Наумюк. – Гродно : ГрГМУ, 2013. – 126с.

Данное учебно-методическое пособие составлено в соответствии с учебной программой курса «Математическая статистика в медицине». В состав издания входят теоретические вопросы, примеры решения и лабораторные работы с примерами выполнения. Цель данного издания состоит в облегчении самостоятельной подготовки студентов к занятиям по дисциплине.

Пособие будет полезным как студентам-медикам, так и врачам, аспирантам и магистрантам медицинских ВУЗов.

© Копыцкий А.В., Наумюк Е.П., 2013 © УО «ГрГМУ», 2013

2

СОДЕРЖАНИЕ

 

Предисловие ..........................................................................................................................

6

Глава 1. Основные понятия и теоремы теории вероятностей.

 

Повторные независимые испытания..................................................................................

7

1.1. Определение вероятности. Основные понятия и теоремы

 

теории вероятностей.............................................................................................................

7

1.1.1. Случайные события. Основные понятия. Действия над событиями ....................

7

1.1.2. Классическое и статистическое определение вероятности

 

случайного события .............................................................................................................

7

1.1.3. Теоремы теории вероятностей..................................................................................

8

1.1.4. Условная вероятность. Теорема умножения вероятностей

 

для зависимых событий. Формула полной вероятности..................................................

8

Примеры решения задач.......................................................................................................

9

1.2. Повторные независимые испытания...........................................................................

13

1.2.1. Повторные независимые испытания. Формула Бернулли ....................................

13

1.2.2. Локальная теорема Муавра – Лапласа. ...................................................................

13

1.2.3. Формула Пуассона ....................................................................................................

13

Примеры решения задач......................................................................................................

14

Глава 2. Дискретные случайные величины .......................................................................

18

2.1. Случайные величины: дискретные и непрерывные ..................................................

18

2.2. Закон распределения дискретной случайной величины...............................................

18

2.3. Функция распределения дискретной случайной величины......................................

19

2.4. Математические характеристики дискретных случайных величин:

 

математическое ожидание, дисперсия, среднее квадратическое отклонение ...............

19

Примеры решения задач......................................................................................................

20

Глава 3. Некоторые законы распределений случайных величин....................................

23

3.1. Биномиальное распределение......................................................................................

23

3.2. Распределение Пуассона ..............................................................................................

23

3.3. Равномерное распределение ........................................................................................

24

3.4. Нормальное распределение .........................................................................................

24

Примеры решения задач......................................................................................................

26

Глава 4. Выборочный метод. Погрешности измерений ...................................................

29

4.1. Выборочный метод. Генеральная совокупность и выборка .....................................

29

4.2. Статистическое распределение выборки. Полигон и гистограмма .........................

29

4.3. Выборочные характеристики и точечные оценки характеристик

 

генеральной совокупности..................................................................................................

31

4.4. Доверительный интервал для оценки математического ожидания

 

нормального распределения ...............................................................................................

32

4.5. Оценка случайных погрешностей при прямых и косвенных измерениях ..............

32

4.5.1. Типы ошибок измерений..........................................................................................

32

4.5.2. Анализ результатов прямых измерений .................................................................

33

Примеры решения задач......................................................................................................

34

Глава 5. Элементы описательной статистики ...................................................................

38

5.1. Меры центральной тенденции (показатели положения центра распределения)....

38

5.1.1. Среднее (выборочное среднее) ................................................................................

38

5.1.2. Мода распределения .................................................................................................

38

5.1.3. Медиана .....................................................................................................................

39

5.2. Структурные точки ряда распределения ....................................................................

39

5.3. Меры разброса (вариации) ...........................................................................................

40

5.3.1. Размах вариации........................................................................................................

40

5.3.2. Квартильный (межквартильный) размах ................................................................

40

3

 

5.3.3. Среднее линейное отклонение.................................................................................

41

5.3.4. Дисперсия ..................................................................................................................

41

5.3.5. Среднее квадратическое отклонение ......................................................................

41

5.3.6. Относительные показатели вариации .....................................................................

42

5.4. Графическое представление данных...........................................................................

42

5.5. Центральный момент. Показатели асимметрии и эксцесса......................................

44

5.5.1. Центральный момент................................................................................................

44

5.5.2. Показатели асимметрии и эксцесса.........................................................................

45

Глава 6. Статистические гипотезы. Статистические критерии.......................................

46

6.1. Переменные. Шкалы измерения. Метод ранжирования..............................................

46

6.1.1. Переменные. Шкалы измерений .............................................................................

46

6.1.2. Метод ранжирования................................................................................................

47

6.2. Статистические гипотезы.............................................................................................

48

6.2.1. Понятие о статистических гипотезах......................................................................

48

6.2.2. Ошибки при проверке гипотез. Уровни статистической значимости .................

49

6.3. Статистические критерии ............................................................................................

50

6.3.1. Понятие о статистических критериях .....................................................................

50

6.3.2. Мощность статистических критериев.....................................................................

51

6.4. Классификация задач, решаемых с помощью статистических методов .................

52

Глава 7. Параметрические критерии сравнения оценок средних и дисперсий .............

53

7.1. F-критерий Фишера для сравнения оценок дисперсий ..............................................

53

7.2. t-критерий Стьюдента ..................................................................................................

53

7.2.1. t-критерий Стьюдента для сравнения средних для малых выборок. ...................

53

7.2.2. t-критерий Стьюдента для сравнения средних для больших выборок ................

54

Примеры решения задач......................................................................................................

54

Глава 8. Непараметрические критерии выявления различий

 

в уровне исследуемого признака........................................................................................

57

8.1. Задачи выявления различий в уровне исследуемого признака.

 

Алгоритм принятия решения о выборе критерия .............................................................

57

8.2. Q-критерий Розенбаума................................................................................................

58

8.3. U-критерий Манна-Уитни............................................................................................

59

8.4. H-критерий Крускала-Уоллиса....................................................................................

60

8.5. S-критерий тенденций Джонкира................................................................................

61

Примеры решения задач......................................................................................................

62

Глава 9. Непараметрические критерии выявления сдвига значений

 

исследуемого признака........................................................................................................

68

9.1. Задачи выявления достоверности сдвига значений

 

исследуемого признака. Алгоритм принятия решения о выборе критерия ...................

68

9.2. G-критерий знаков ........................................................................................................

68

9.3. T-критерий Вилкоксона................................................................................................

69

9.4. χ2r-критерий Фридмана.................................................................................................

70

9.5. L-критерий тенденций Пейджа....................................................................................

71

Примеры решения задач......................................................................................................

72

Глава 10. Критерии Выявления различий в распределении признака............................

78

10.1. Задачи выявления различий в распределении признака .........................................

78

10.2. χ2-критерий Пирсона ..................................................................................................

79

10.3. λ-критерий Колмогорова-Смирнова .........................................................................

81

Примеры решения задач......................................................................................................

83

Глава 11. Многофункциональные статистические критерии ..........................................

89

Многофункциональный статистический критерий φ*.....................................................

89

Примеры решения задач......................................................................................................

90

Глава 12. Элементы корреляционного и регрессионного анализа..................................

92

4

 

12.1. Статистическая и корреляционная зависимости .....................................................

92

12.2. Показатели статистической связи .............................................................................

92

12.3. Форма и направление корреляционной связи: уравнение регрессии, линия

 

регрессии ..............................................................................................................................

94

12.4. Непараметрические коэффициенты корреляции .....................................................

94

12.4.1. Коэффициент корреляции τ-Кендалла..................................................................

95

12.4.2. Коэффициент ассоциации φ...................................................................................

95

12.4.3. Рангово-бисериальный коэффициент корреляции. .............................................

96

12.4.4. Коэффициент ранговой корреляции rs-Спирмена ...............................................

96

Примеры решения задач......................................................................................................

99

Статистические таблицы....................................................................................................

106

5

ПРЕДИСЛОВИЕ

Данное учебно-методическое пособие предназначено для студентов медикопсихологического факультета, изучающих курс «Математическая статистика в медицине», а также для врачей-психологов, использующих статистические методы в своей работе. Кроме того, данное издание может быть полезно аспирантам и магистрантам высших медицинских учебных заведений при обработке и анализе информации, полученной в ходе научных исследований.

Структурно издание состоит из глав, в каждом параграфе которых коротко рассматриваются теоретические вопросы. Для лучшего понимания методов решения статистических задач в главах 1–4, 7–12 приводятся примеры решения задач с подробными комментариями.

К главам 3, 5, 12 предлагаются лабораторные работы № 1, № 2, № 3, соответственно, находящиеся в главе 13. Все лабораторные работы снабжены примерами выполнения.

В приложении 7 находятся необходимые при решении задач статистические таблицы.

6

ГЛАВА 1. ОСНОВНЫЕ ПОНЯТИЯ И ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ.

ПОВТОРНЫЕ НЕЗАВИСИМЫЕ ИСПЫТАНИЯ

1.1. Определение вероятности. Основные понятия и теоремы теории вероятностей

Теория вероятностей раздел математики, который изучает закономерности массовых явлений, носящих случайный характер. Объекты теории вероятностей являются абстракциями от реальных объектов, а результаты математическими моделями реальных явлений.

1.1.1. Случайные события. Основные понятия. Действия над событиями

Почти в каждой области человеческой деятельности приходится иметь дело с наблюдениями, экспериментами, совершаемыми с многократным повторением, и при практически неизменных внешних условиях.

Испытание комплекс условий, который может быть воспроизведен сколь угодно много раз.

Событие – результат, исход испытания. Требование к теоретико-вероятностному эксперименту: задание множества возможных исходов отдельного испытания, но при этом до получения результата нельзя предсказать, какой именно из исходов осуществится. Событие, которое в результате испытания может произойти или не произойти называется случайным (обозначается буквами A, B, C, D,…).

Достоверное событие обязательно происходит в результате данного испытания (обозначается буквой U).

Невозможное событие не может произойти в результате данного испытания (обозначается буквой V или (последний знак читается как «пустое множество»)).

Сумма (объединение) событий A и B – такое событие, которое заключается в осуществлении хотя бы одного из них (или A, или B, или A и B вместе) (обозначается A+B или A B (последнее выражение читается как «объединение множеств»)).

Произведение (пересечение) событий A и B – событие, которое заключается в их совместном осуществлении (обозначается AB или A B (последнее выражение читается как «пересечение множеств»)).

Несовместные события A и B – в результате данного испытания их совместное осуществление невозможно, т. е. AB= .

Особый интерес представляет полная группа попарно несовместных событий такая совокупность событий, что A1 A2 A3 ... An U и AiAj= , при i j. Говорят, что U рас-

падается на n частных случаев. Очевидно, что всякая такая группа может быть разбита на непересекающиеся подмножества.

Противоположными называют два несовместных события A и B, образующих полную группу, т. е. AB= и A+B=U (обозначается B A ).

1.1.2. Классическое и статистическое определение вероятности случайного события

а) Классическое определение вероятности случайного события (по Лапласу).

n

Пусть достоверное событие U распадается на n равновозможных:U Ai , сумма m из

i 1

которых, дает событие А. Тогда принято говорить, что в данном испытании имеется n случаев, из которых m благоприятствуют появлению события А. Вероятностью события А называют отношение числа m случаев, благоприятствующих событию А, к числу n всех равновозможных событий:

7

p( A)

m

 

n

 

 

 

Свойства вероятности:

1. 0 p(A) 1

, так как 0 m n ;

2. Вероятность достоверного события равна 1: бытия m n .

3. Вероятность невозможного события равна 0; бытия m 0 .

p(U ) 1

, так как для достоверного со-

 

p( )=0, так как для невозможного со-

б) Статистическое определение вероятности.

Пусть серию из n испытаний проводят в одних и тех же условиях. Причем интересующее нас событие А осуществилось m раз, тогда m называют частотой события А, а отношение:

p

 

 

m

 

n

 

 

 

называют относительной частотой события А (или частостью).

Экспериментальным фактом является то, что p при большом числе испытаний обнаруживает свойство стабильности, группируется около определенного значения, и при n , p представляет собой статистическую вероятность события А, или:

p( A) lim p

*

lim

m

 

 

 

n

 

n n

1.1.3. Теоремы теории вероятностей

а) Теорема сложения вероятностей для несовместных событий:

Вероятность суммы двух несовместных событий A и B (вероятность осуществления одного из двух несовместных событий) равна сумме их вероятностей.

P(A B) P(A) P(B)

Следствие: вероятность наступления одного из нескольких попарно несовместных событий равна сумме вероятностей этих событий.

 

 

 

n

p( A A A ) p( A )

1

2

n

i

 

 

 

i 1

Два события А и В называют независимыми, если вероятность осуществления события А не зависит от того, осуществилось ли событие В.

б) Теорема умножения вероятностей для независимых событий:

Вероятность произведения двух независимых событий А и В (вероятность совместного осуществления двух независимых событий А и В) равна произведению вероятностей этих событий:

p( AB) p( A) p(B)

Теорема распространяется на n независимых событий: p(A1A2...An ) p( A1) p(A2 ) ... p( An )

1.1.4. Условная вероятность. Теорема умножения вероятностей для зависимых событий. Формула полной вероятности

Событие B называется зависимым от события A, если вероятность события B зависит от осуществления события A. Вероятность осуществления события B, при условии, что A

8

осуществилось, будем обозначать p(B/A) и называть условной вероятностью события B при условии A.

Теорема умножения вероятностей зависимых событий:

Вероятность произведения двух зависимых событий А и В равна произведению вероятности одного из них на условную вероятность второго, при условии, что первое осуществилось.

p( AB) p(A) p(B / A)

Следствием теоремы сложения вероятностей для несовместных событий, образующих полную группу, и теоремы умножения вероятностей для зависимых событий является так называемая формула полной вероятности:

n

 

p( A) p( A ) p( A / A )

i

i

i 1

 

Теорема: Вероятность события А, которое может осуществиться лишь при условии осуществления лишь одного из несовместных событий А1, А2,…, Аn, образующих полную группу, равна сумме произведения вероятностей каждого из этих событий на соответствующую условную вероятность события А.

Примеры решения задач

Пример 1. В корзине находятся 3 черных и 4 белых шара. Найти вероятность того, что при случайном извлечении шара будет извлечен: а) белый шар, б) чёрный шар.

Решение:

Так как в данном случае мы имеем дело с доопытным определением вероятности события, то при решении будем использовать классическое определение вероятности.

Согласно классическому определению вероятности случайного события, вероятность события определяется как отношение числа исходов, благоприятствующих данному событию, к общему числу исходов.

а) Пусть A – событие, состоящее в том, что был извлечён белый шар из корзины. Тогда число исходов, благоприятствующих данному событию, равно m = 4 (так как в корзине всего 4 белых шара). Общее число возможных исходов равно n = 7 (так как в корзине всего 3 чёр-

ных 4 белых шара: 3+ 4 = 7 ). Тогда вероятность события

A будет равна:

P A = m / n = 4 / 7 .

 

На примере случая б) рассмотрим ещё один способ оформления решения задач.

б) Пусть A={«Из корзины был извлечён чёрный шар»}. Тогда число исходов, в ходе ко-

торых может реализоваться событие

A , будет равно

m = 3

(так как из корзины могут быть

извлечены 3 чёрных шара), и общее число всех возможных число исходов будет равно

n = 7

(так как в корзине всего 7 шаров). Следовательно, искомая вероятность будет

равна

P A = m / n = 3/ 7 .

 

Пример 2. Студенты одной из групп медико-психологического факультета написали контрольную работу по математической статистике. Оценки в группе расположились следующим образом: 2 студента получили 9, ещё 2 – 8, 4 студента – 7, 3 студента – 5, 1 студент – 4, и 2 студента – 3. Найти вероятность того, что случайно выбранный студент из группы будет иметь оценку выше 4.

Решение:

Введем обозначение:

A={«Случайно выбранный студент имеет оценку выше 4»}.

Так как в данном случае мы имеем дело с послеопытным определением вероятности, то будем использовать при решении статистическое определение вероятности, согласно которому вероятность события равна относительной частоте данного события (или отношению

9

числа исходов, в ходе которых реализовалось данное событие, к общему числу испытаний).

Итак, число исходов, в ходе которых реализовалось событие

A

будет равно

m = 2+ 2+ 4+3 = 11 (столько студентов получили оценку выше 4). Общее же число прове-

дённых испытаний будет равно

n = 2+ 2+ 4+ 3+1+ 2 =14 (столько студентов участвовали

в написании контрольной работы). Следовательно, искомая вероятность будет равна:

P A = m / n =11/14 .

 

Примечание: при решении задач по теории вероятностей, связанных с использованием теорем сложения и умножения вероятностей, удобно пользоваться следующим методом решения. Для нахождения вероятности некоторого события нужно записать данное событие на языке математической логики, используя следующие обозначения:

« A1 + A2 » – сумма событий, – событие состоящее в том, что происходит либо событие

A1

, либо событие

A2

, либо оба совместно. Если события

A1

и

A2

– несовместны, то их

сумма будет состоять в том, что произойдет только одно из них. Когда говорят о несовместных событиях (а не об их вероятностях!) то знак «+» обозначает «ИЛИ». Например, выраже-

ние « B + B

» обозначает, что произойдёт или событие

B

, или B

2

(в случае их несовмест-

 

1

2

 

1

 

 

 

 

ности).

 

 

 

 

 

 

 

 

 

«

A1

A2

» – произведение событий, – событие состоящее в том, что события

A1 и

A2

происходят совместно (в случае их совместности). Когда говорят о совместных событиях (а

не об их вероятностях!), то знак «∙» обозначает «И». Например, выражение « B1 B2

» обозна-

чает, что события

B1 и B2 происходят совместно.

 

 

 

Рассмотрим решение предыдущей задачи с помощью описанного метода.

 

Пример 2*.

 

 

 

 

 

 

Вводим следующие обозначения:

 

 

 

 

A={«Студент получил оценку выше 4»},

 

 

 

 

A9={«Студент получил оценку 9»},

 

 

 

 

A8={«Студент получил оценку 8»},

 

 

 

 

A7={«Студент получил оценку 7»},

 

 

 

 

A6={«Студент получил оценку 6»},

 

 

 

 

A5={«Студент получил оценку 5»},

 

 

 

 

Используя

статистическое

определение

вероятности, находим

вероятности

собы-

тий: A9 , A8 , A7 , A6 , A5 :

 

 

 

 

 

P( A ) = 2 /14, P( A ) = 2 /14

, P( A ) = 4 /14 ,

P( A ) = 0 /14 0 , P( A ) = 3 /14 .

 

9

8

7

6

5

 

 

Представляем сейчас событие A в виде комбинации событий A9

, A8 , A7 , A6

, A5 .

Случайно выбранный студент получил оценку более 4 баллов (событие

A ) в том случае, ес-

ли он получил или 9 баллов (событие A9 ), или 8 баллов (событие A8 ), или 7 баллов (событие

A7 ), или 6 баллов (событие A6

), или 5 баллов (событие

A5 ). Так как эти события несов-

местны (студент не может получить несколько оценок за одну контрольную работу), и может произойти только одно из них, то событие A можно записать в виде:

A = A9 + A8 + A7 A6 + A5 (напоминаем, что при описании событий знак «+» обозначает логическое «ИЛИ»).

Находим сейчас вероятность события A : p A = P A9 + A8 + A7 + A6 A5 .

Используя теорему сложения несовместных событий и ранее определённые вероятности, получаем искомую вероятность:

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]