Методичка по медицинской статистике
.pdf
|
|
|
Среднее |
|
|
|
|
|
|
|
|
Месяц |
Средняя |
количество |
dx |
dy |
dx2 |
dy2 |
dx · dy |
||||
года |
температ |
детей, |
|
|
|
|
|
|
|
||
|
|
ура |
умерших |
|
|
|
|
|
|
|
|
|
|
воздуха |
от острых |
|
|
|
|
|
|
|
|
|
|
(Со) |
кишечных |
|
|
|
|
|
|
|
|
|
|
|
инфекций |
|
|
|
|
|
|
|
|
|
|
|
(в день) |
|
|
|
|
|
|
|
|
|
|
|
|
(y) |
|
|
|
|
|
|
|
|
|
(x) |
|
|
|
|
|
|
|
|
|
Январь |
5 |
5,0 |
- 4,9 |
- 3,8 |
24,01 |
14,44 |
18,62 |
||||
Февраль |
2 |
5,5 |
- 7,9 |
- 3,3 |
62,41 |
10,89 |
26,07 |
||||
Март |
4 |
6,2 |
- 5,9 |
- 2,6 |
34,81 |
6,76 |
15,34 |
||||
Апрель |
8 |
5,4 |
- 1,9 |
- 3,4 |
3,61 |
11,56 |
6,46 |
|
|||
Май |
15 |
6,5 |
5,1 |
- 2,3 |
26,01 |
5,29 |
- 11,73 |
||||
Июнь |
17 |
9,6 |
7,1 |
0,8 |
50,41 |
0,64 |
5,68 |
|
|||
Июль |
18 |
11,2 |
8,1 |
2,4 |
65,61 |
5,76 |
19,44 |
||||
Август |
17 |
15,3 |
7,1 |
6,5 |
50,41 |
42,25 |
46,15 |
||||
Сентябрь |
15 |
14,9 |
5,1 |
6,1 |
26,01 |
37,21 |
31,11 |
||||
Октябрь |
9 |
13,0 |
- 0,9 |
4,2 |
0,81 |
17,64 |
- 3,78 |
||||
Ноябрь |
6 |
7,0 |
- 3,9 |
- 1,8 |
15,21 |
3,24 |
7,02 |
|
|||
Декабрь |
3 |
6,6 |
- 6,9 |
- 2,6 |
47,61 |
6,76 |
17,94 |
||||
n = 12 |
Σ = 119,0 |
Σ= 105,2 |
|
|
|
Σ=406,92 |
Σ=162,44 |
Σ=178,32 |
|||
|
|
Мх = 9,9 |
Му = 8,8 |
|
|
|
|
|
|
|
|
|
Вычисление коэффициента корреляции: |
|
|
|
|||||||
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|||||
|
rxy |
= Σ dx · dy / Σ dx2 · |
dy2 = 178,32 / 406,92 · 162,44 = +0,7 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
Расчет ошибки коэффициента корреляции:
mr = ±
1 – r2xy / n – 2 = ±
1 – 0,49/ 12 – 2 = ±
0,51/10 = ±0,226
Оценка достоверности коэффициента корреляции:
t = rxy / mr = 0,7 / 0,226 = 3,1
Заключение: с достаточной для медицинских исследований надежностью, можно утверждать, что между среднемесячной температурой воздуха и числом детей в возрасте до 1 года, умерших от острых кишечных инфекций, существует прямая сильная корреляционная связь.
Коэффициент корреляции рангов Спирмена основан на рассмотрении разности рангов значений результативного и факторного признаков.
Ранговая корреляция – это непараметрический аналог параметрических методов корреляции, существует в форме
111
коэффициента ранговой корреляции, обозначаемого греческой буквой ρ (ро). Он применяется для определения степени связи между двумя переменными, значения которых представлены рангами, а не «сырыми» или стандартизованными оценками.
Метод предполагает проведение ранжирования показателей в отдельности для каждого из признаков.
Рекомендации по применению метода ранговой корреляции (метод Спирмена):
−метод ранговой корреляции применяется, когда нет необходимости в точном установлении силы связи, а достаточно ориентировочных данных;
−метод ранговой корреляции применяется, когда признаки представлены не только количественными, но и атрибутивными значениями;
−метод ранговой корреляции применяется, когда ряды распределения признаков имеют открытые варианты (например, стаж работы < 1 года; возраст < меньше 20 лет и др.)
Последовательность расчета коэффициента корреляции методом рангов:
1. Составление рядов парных признаков х и y.
2.Замена каждой величины признака ранговым (порядковым) номером - х1 и y1.
3.Определение разности рангов d = x1 - y1.
4.Возведение в квадрат разности рангов - d2.
5.Получение суммы квадратов разности рангов Σd2.
6.Вычисление коэффициента ранговой корреляции по
формуле:
ρxy = 1 - 6 · Σd2 / n · (n2 – 1)
где:
6 - постоянный коэффициент; n - число наблюдений.
7.Определение направления и силы связи (см. таблицу
6.2.2).
8.Расчет ошибки коэффициента ранговой корреляции mρ по формуле:
mr = ±
1 – ρ2xy / n - 2
112
9. Расчет критерия t и оценка достоверности коэффициента корреляции:
t = ρxy / mρ
Схема вычисления коэффициента корреляции методом рангов.
Таблица 6.2.2
Схема вычисления коэффициента корреляции методом рангов между возрастом студентов медицинского университета и их массой тела
Порядковый |
Возраст (в |
Масса |
Ранги |
Ранги по |
|
|
номер |
годах) |
тела |
по |
массе |
d |
d2 |
студента |
|
(в кг) |
возрасту |
тела |
|
|
|
(х) |
(у) |
|
|
|
|
|
|
|
(х1) |
(у1) |
|
|
1 |
22 |
56 |
2,5 |
1 |
- 1,5 |
2,25 |
2 |
22 |
57 |
2,5 |
2 |
0,5 |
0,25 |
3 |
21 |
59 |
1 |
3 |
- 2 |
4,0 |
4 |
24 |
60 |
7,5 |
4 |
3,5 |
12,25 |
5 |
23 |
63 |
5 |
5 |
0 |
0 |
6 |
23 |
65 |
5 |
6 |
- 1,0 |
1 |
7 |
24 |
67 |
7,5 |
7 |
0,5 |
0,25 |
8 |
23 |
72 |
5 |
8 |
- 3,0 |
9,0 |
9 |
24 |
79 |
7,5 |
9 |
- 1,5 |
2,25 |
10 |
24 |
82 |
7,5 |
10 |
- 2,5 |
6,25 |
n = 10 |
|
|
|
|
|
Σ= 37,5 |
Замена каждой величины признака ранговым (порядковым) номером - х1 и y1:
При обозначении показателей рангами, начинают с меньшего (или с большего) в обоих рядах. Если отдельные показатели ряда встречаются несколько раз (например, 22; 23; 24), ранги проставляются следующим образом: возраст 22 года – встречается дважды, занимая по величине 2 и 3 ранговые места, поэтому порядковые номера в этом случае будут равны полусумме занимаемых этим возрастом мест - (2 + 3) / 2 = 2,5, то есть против каждого показателя возраста 22 года проставляется ранг 2,5. Возраст 23 года встречается 3 раза, занимая 4, 5 и 6 ранговые места. Ранги для возраста 23 года будут равны: (4 + 5 + 6) / 3 = 5, то есть против каждого показателя возраста 23 года проставляется ранг 5 и т.д.
Вычисление коэффициента ранговой корреляции:
ρxy = 1 -6 ·Σd /n ·(n2 –1) =1- 6 ·37,5/10 ·(102 –1) =1-225/990 = 1-0,2 = + 0,8
Расчет ошибки коэффициента ранговой корреляции:
113
mr = ±
1 – ρ2xy / n – 2 = ±
1- 0,64/10 – 2 = ±
0,045 = ±0,2
Расчет критерия t и оценка достоверности коэффициента
корреляции:
t = ρxy / mρ = 0,8 / 0,2 = 4
Заключение: с достаточной для медицинских исследований надежностью, можно утверждать, что между возрастом студентов медицинского университета и их массой тела, существует прямая сильная корреляционная связь.
Еще раз остановимся на преимуществах метода Спирмена перед методом Пирсона.
1.Метод Спирмена можно использовать при открытых значениях вариант (< 20; > 15 и т.д.).
2.Метод Спирмена можно использовать, если нет возможности измерить числовые значения вариант. Например, если нужно установить есть ли связь между ростом и весом у студентов в аудитории, в которой нет измерительных приборов. Можно проранжировать (построить) студентов по росту и весу. Метод Пирсона в этом случае не применим.
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
Вопросы для самостоятельной подготовки
1.Виды связи между явлениями и признаками.
2.Отличие корреляционной зависимости от функциональной. Примеры.
3.Прямая и обратная связь. Значения коэффициента корреляции, указывающие на наличие «слабой», «средней» и «сильной» связи.
4.Методы вычисления коэффициента корреляции.
5.Последовательность расчета коэффициента корреляции по методу квадратов.
6.Формула определения коэффициента корреляции по методу квадратов (Пирсона). Формула расчета ошибки коэффициента корреляции по методу квадратов.
114
7.Последовательность расчета коэффициента корреляции
рангов.
8.Формула определения коэффициента корреляции по методу рангов (Спирмена). Формула расчета ошибки коэффициента ранговой корреляции.
9.Определение достоверности коэффициента корреляции.
Задачи для самостоятельного решения
Задача 1. Определите характер и силу связи между возрастом пациентов, прошедших медицинский осмотр, и числом выявленных у них хронических заболеваний.
Возраст лиц, прошедших |
Абсолютное число хронических |
медицинский осмотр (лет) |
заболеваний (на 100 осмотренных) |
29 |
120,5 |
30 |
190,0 |
39 |
150,6 |
40 |
260,3 |
49 |
350,7 |
Оцените достоверность полученных результатов.
Задача 2. Определите направление и силу связи между показателями плодовитости и возрастом женщин. Оцените достоверность полученных результатов.
Возраст женщин |
Показатели плодовитости (на 1000 женщин |
(лет) |
соответствующего возраста) |
15 – 19 |
47,2 |
20 – 24 |
119,5 |
25 – 29 |
61,8 |
30 – 34 |
28,3 |
35 – 39 |
11,1 |
40 – 44 |
2,5 |
45 – 49 |
0,2 |
Задача 3. В трех районах города N. Проводилось изучение заболеваемости студентов респираторными инфекциями в зависимости от посещения образовательных учреждений. При этом была установлена связь (ρxy=-0,85).
Оцените силу и направление связи. Можно ли утверждать, что при единой для всего города посещаемости образовательных учреждений эта закономерность характерна для заболеваемости
115
респираторными инфекциями студентами всего города? Является ли условие задачи достаточным для такого утверждения?
Тестовые задания
1. Функциональная связь:
1)это связь, которая означает строгую зависимость явлений, т.е. каждому значению одного из признаков соответствует строго определенное значение другого
2)это связь, при которой значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака
3)это понятие, характеризующее вероятность безошибочного пpогноза
4)численное расхождение между результатами сплошного и выборочного исследования
2. Корреляционная связь:
1)это связь, которая означает строгую зависимость явлений, т.е. каждому значению одного из признаков соответствует строго определенное значение другого
2)это связь, при которой значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака
3)это понятие, характеризующее вероятность безошибочного пpогноза
4)численное расхождение между результатами сплошного и выборочного исследования
3. Какой характер носят зависимости в клинической медицине, биологии и социальногигиенических явлениях?
1)функциональный
2)корреляционный
3)функциональной и корреляционной
4)ни один из представленных
4. К функциональной связи не относятся:
1)рост человека и его вес
2)длина радиуса круга и его площадь
3)температура нагревания и степень расширения тела
4)зависимость скорости свободно падающего тела от величины ускорения, силы тяжести и времени падения
5. Выберите примеры корреляционной связи.
116
1)длина радиуса круга и его площадь
2)температура нагревания и степень расширения тела
3)уровень температуры тела человека и число сердечных сокращений
4)зависимость скорости свободно падающего тела от величины ускорения, силы тяжести и времени падения
6. Какие виды корреляционной связи не встречаются:
1)прямая
2)обратная
3)полная
4)общая
7. В каких пределах может находиться коэффициент корреляции?
1)от 0 до 10.
2)от 0 до 100.
3)от (-1) до (+1).
4)от (-10) до (+10).
8. Во сколько раз минимум должен превышать коэффициент корреляции свою ошибку, чтобы он считался достоверным?
1)в 1,5 раза
2)в 2 раза
3)в 3 раза
4)в 5 раз
9. Укажите, какое значение коэффициента корреляции соответствуют прямой сильной связи?
1)(-1,0)
2)(-0,75)
3)(+0,2)
4)(+0,9)
10. Укажите, какое значение коэффициента корреляции соответствуют прямой связи средней силы?
1)(-1,0)
2)(-0,75)
3)(+0,1)
4)(+0,4)
117
ГЛАВА VII
ПОНЯТИЕ О СТАТИСТИЧЕСКИХ ГРАФИКАХ И ПРАВИЛА
ИХ ПОСТРОЕНИЯ
§ 1. Статистический график и его элементы
Графический метод - это метод условных изображений статистических данных при помощи геометрических фигур, линий, точек и разнообразных символических образов. В
медицинской практике графические изображения используются для иллюстрации статистических данных, характеризующих показатели здоровья и здравоохранения.
Главное достоинство любого из видов графических изображений - наглядность. При правильном построении графика статистические показатели привлекают к себе внимание, становятся выразительными, лаконичными и запоминающимися.
Для построения графика необходимо знать, для каких целей он составляется, изучить исходный материал и владеть методикой графических изображений.
118
Графиками в статистике называются условные изображения числовых величин и их соотношений в виде различных геометрических образов - точек, линий, плоских фигур и т.п.
Использование графиков для изложения статистических показателей позволяет придать последним не только наглядность и выразительность, но и облегчить их восприятие, а во многих случаях помогает уяснить сущность изучаемого явления, его закономерности и особенности, увидеть тенденции его развития, взаимосвязь характеризующих его показателей.
Каждый график состоит из графического образа и вспомогательных элементов.
Графический образ - это совокупность точек, линий и фигур, с помощью которых изображаются статистические данные. Эти знаки образуют собственно языковую ткань графика, его основу.
Вспомогательными элементами графика являются:
1). Поле графика - это пространство, на котором размещаются образующие график геометрические фигуры.
Геометрические знаки или образы - это многообразные знаки, с помощью которых изображают статистические величины. В статистических графиках в качестве геометрических знаков используются точки, отрезки прямой линии, квадраты, прямоугольники, а также фигуры в виде рисунков или силуэтов изображаемых предметов.
Знак составляет основу графика, его язык. Одни и те же данные графически должны быть изображены различными знаками в зависимости от того, какой аспект явления должен подчеркнуть график, на что нацелить внимание его читателя. Например, чтобы показать тенденцию заболеваемости или смертности за ряд лет, целесообразно использовать отрезки прямых линий, соединяющих точки на поле графика. Направление прямых линий вверх (вниз) будет свидетельствовать о росте (снижении) заболеваемости (смертности), а угол наклона будет характеризовать интенсивность этого непрерывного процесса за отдельные периоды. Если же ставится задача - показать изменение уровня заболеваемости (смертности) по полу (у мужчин и женщин), тогда эти же данные следует изобразить в виде прямоугольных столбиков различной высоты.
119
2)Масштабные ориентиры статистических графиков - это масштаб, масштабные шкалы и масштабные знаки.
Масштаб - это условная мера перевода числовой величины
вграфическую и обратно. При построении графика масштаб должен быть таким, чтобы подлежащие нанесению на график данные поместились на поле графика. На вертикальной шкале графика должна быть нулевая точка. В тех случаях, когда минимальное значение признака намного выше нуля, нецелесообразно вести отсчет от нулевой точки, так как поле графика будет заполнено неравномерно. В таких случаях рекомендуется делать разрыв вертикальной шкалы.
Масштабная шкала - это линия, разделенная на отрезки точками. Наиболее часто в статистических графиках используются располагающиеся по осям координат равномерные прямолинейные масштабные шкалы, в которых отрезки между двумя соседними точками (графические интервалы) строго пропорциональны размерам и периодам времени изображаемых на графике данных. В секторных диаграммах используются криволинейные масштабные шкалы. Площадь круга делится на сектора пропорционально изображаемым на графике числам.
Масштабные знаки - это эталоны величин, изображаемых на графике в виде отдельных графических знаков: квадратов, кругов, рисунков, силуэтов и др. Ими пользуются для сравнения графических знаков со знаком-эталоном.
3)Экспликация графика - это пояснения, раскрывающие содержание графика: заголовок графика, единицы измерения, условные обозначения.
Пояснительные надписи к отдельным элементам графика могут быть помещены либо на поле графика, либо в форме условных обозначений за пределами поля графика. Все надписи рекомендуется выполнять горизонтально. Не следует использовать для закраски графиков слишком пестрые и яркие цвета. Заголовок графика должен кратко и точно ответить на три вопроса - что, где, когда?
Графики, применяемые для изображения статистических данных, чрезвычайно разнообразны.
Графические изображения используются чаше всего для сравнения между собой статистических величин, определения роли отдельных факторов во всей их совокупности, изучения
120
