- •Содержание
- •1 Введение в медицинскую
- •2 Этапы статистического
- •2.1 Цель и задачи исследования
- •2.2 План и программа статистического исследования
- •2.2.1 Статистическая совокупность, единица наблюдения, учетные признаки.
- •2.2.2 Программа сбора. Генеральная и выборочная совокупности. Репрезентативность данных. Ошибки репрезентативности.
- •2.2.3 Планирование эксперимента с малым числом наблюдений.
- •2.2.4 Программа разработки статистических
- •2.3 Основы работы с программой мs Ехсеl
- •2.3.1 Ввод и редактирование данных.
- •2.3.2 Выделение блока ячеек.
- •2.3.3 Ввод математических формул
- •2.3.4 Копирование данных
- •2.3.5 Дублирование формул
- •2.3.6 Формирование границ таблицы
- •2.4 Статистические таблицы.
- •2.4.1 Формирование статистических и сводных таблиц в мs Ехсеl
- •2.5 Графические изображения
- •2.5.1 Правила построения графических изображений (диаграмм)
- •2.5.2 Основные типы диаграмм
- •Петербурга в показателях наглядности
- •2.5.3 Специальные диаграммы
- •3 Относительные величины.
- •4 Основы математико-статистической обработки данных. Показатели описательной статистики
- •4.1 Ряды распределений. Вариационные ряды.
- •4.1.1 Построение вариационных рядов в мs Ехсеl
- •4.2.1 Среднее арифметическое и другие степенные средние
- •4.2.2 Мода и медиана
- •2.2.3 Вычисление среднего взвешенного и некоторых степенных средних в ms Excel
- •4.3 Показатели рассеяния вариант
- •4.3.1 Дисперсия
- •4.3.2 Среднеквадратическое отклонение
- •4.3.3 Коэффициент вариации
- •4.3.4 Квантили
- •4.3.5 Использование мs Ехсеl для нахождения квантилей
- •4.3.6 Статистические моменты. Асимметрия и эксцесс
- •4.5 Оценка статистических параметров по выборочным данным
- •4.5.1 Доверительная значимость, доверительная вероятность, доверительный интервал, доверительный предел
- •4.6 Вычисление показателей описательной статистики ms Excel
- •5 Теоретические распределения
- •5.2 Критерии совпадения эмпирических и теоретических распределений. Статистические оценки нормальности распределения
- •5.3 Нахождение нормального распределения с помощью мs Ехсеl
- •5.3.1 Критерий согласия Пирсона х2
- •5.3.2 Критерий согласия Колмогорова к()
- •6 Статистическая связь между признаками. Основные виды связи.
- •6.1 Оценка взаимосвязи количественных признаков
- •6.1.1 Регрессия
- •1. Элиминирование влияние третьего признака и выявление связи между первым и вторым производится по формуле:
- •6.3.1 Коэффициенты q и ф
- •6.3.2 Коэффициенты взаимной сопряженности Пирсона (с) и Чупрова (к)
- •6.3.3 Вычисление критерия сопряженности в мs Excel
- •6.3.4 Коэффициент ранговой корреляции Спирмена
- •7 Статистические критерии различия
- •7.1.1 Определение «выскакивающей» варианты с помощью м5 Ехсеl
- •7.5.1 Критерий знаков
- •8 Динамические (временные) ряды
- •9 Оценка различий показателей заболеваемости
- •195067, Санкт-Петербург, Писаревский пр., 47
4.2.2 Мода и медиана
Большое значение при выборе характеристики среднего уровня имеет и распределение вариат в вариационных рядах. В ряде ситуаций вместо степенных средних более целесообразно использовать так называемые структурные средние. К ним относятся мода и медиана.
Мода (Мо) – наиболее часто встречающаяся в ряду распределения вариата. Она дает представление о центре распределения вариационного ряда. Используется:
- для определения центра распределения в открытых вариационных рядах;
- для определения среднего уровня в рядах с резко асимметричным распределением.
Например: требуется определить среднюю длительность госпитализации рабочих промышленных предприятий в связи с производственным травматизмом. При визуальном анализе графического изображения распределения (Рисунок 55) видно, что ряд распределения не симметричен: вершина распределения сдвинута в начало ряда. Если определять среднюю величину на основе среднего арифметического (М), то средняя длительность одной госпитализации составляет 4,2 дня. Однако чаще всего (Мо) длительность госпитализации составляла 3 дня.
Таблица 39
Распределение обследованных больных по длительности госпитализации
Число дней госпитализации v |
Число рабочих p |
Частости |
Накопленные частости |
2 |
6 |
0,10 |
0,10 |
3 |
18 |
0,30 |
0,40 |
4 |
14 |
0,23 |
0,63 |
5 |
10 |
0,17 |
0,80 |
6 |
6 |
0,10 |
0,90 |
7 |
3 |
0,05 |
0,95 |
8 |
2 |
0,03 |
0,98 |
9 |
1 |
0,02 |
1,00 |
Итого |
60 |
1,00 |
- |
Дни госпитализации
Рисунок 55. Распределение обследованных рабочих по длительности госпитализации
Установить моду в дискретном вариационном ряду не представляется сложным – варианта, встречающаяся с наибольшей частотой, и есть мода. В интервальном ряду нахождение моды сложнее.
В
грубом приближении в качестве моды
можно принять середину группы, на
которую приходится наибольшая частота.
Например:
в вариационном ряду таблицы 33 наибольшая
частота соответствует группе 156-157 см.
Середина группы
Более точный результат можно получить
путем вычисления по формуле
,
где Vo
– нижняя граница модального интервала;
h
величина интервала; PMO
–
1
частоты предмонального интервала; PMO
+
1
частоты после модального интервала.
Итак, точное значение моды
Практически, полученное значение равно
приближенной оценке (157 см), полученной
ранее.
Медиана – это серединная варианта, центральный член ранжированного ряда. Название медиана взято из геометрии, где так именуется линия, делящая сторону треугольника на две равные части. В статистике медиана приходится на тот член ранжированного ряда, который «рассекает» совокупность на равные части. Например, в совокупности
Таблица 40
Нечетное число (9) ранжированных вариант
Ранг |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Варианты |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
Медианой будет пятая по счету (ранг=5) варианта 21, ибо четыре значения (17, 18, 19, 20) лежат с одной стороны медианы, и столько же с другой (22, 23, 24, 25). Если вариант в ряду четное количество:
Таблица 41
Четное число (8) ранжированных вариант
Ранг |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Варианты |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
то
медиана равна полусумме двух средних
вариант (21 +22)12=
21,5.
Медиана
в несгруппированном ряду для нечетного
ряда, это варианта, имеющая ранг
,
или
.
(N
– число вариант в ряду). Для четного
ряда медианой является полусумма двух
вариант с рангами
и
,
или в примере полусумма вариант с
рангами
и
,
т.е. полусумма 5 и 4 по счету вариант.
В сгруппированном интервальном вариационном ряду положение медианы устанавливается по накопленным частостям или частотам. Варианта, соответствующая сумме частостей 0,5 (или 50% суммы частот) является медианой ряда. Наиболее наглядно положение медианы видно на диаграмме распределения с накопленными частотами (Рисунок 55).
Для
точного определения медианы в интервальном
ряду используется формула
,
где Vo
– нижняя граница
медианного интервала, h
- величина Sme-1-
накопленные
частоты предмедианного интервала, Sme
- накопленные
частоты медианного интервала, Рme
– частота медиального
интервала, N-
число наблюдений.
Медиана применяется:
для определения среднего уровня признака в числовых рядах с неравными интервалами в группах;
для определения среднего уровня признака, когда исходные данные представлены в виде качественных признаков и когда единственным способом указать некий центр тяжести совокупности является указание варианты (группы вариант), которая занимает центральное положение;
при вычислении некоторых демографических показателей (средней продолжительности предстоящей жизни);
при определении наиболее рационального места расположения учреждений здравоохранения, коммунальных учреждений и т.п. Имеется в виду учет оптимальной удаленности учреждений от всех объектов обслуживания.
В настоящее время очень распространены различные опросы (маркетинговые, социологические и др.), в которых опрашиваемых просят выставить баллы изделиям, политикам и т.п. Затем из полученных оценок рассчитывают средние баллы и рассматривают их как интегральные оценки, выставленные коллективом опрошенных. При этом обычно для определения средних показателей применяют среднее арифметическое. Однако такой способ на самом деле применять нельзя, поскольку баллы - характеристики измеренные в порядковой шкале (см. выше), а вычислять среднее арифметическое характеристик, измеренных в порядковых шкалах, некорректно. Обоснованным в этом случае является использование в качестве средних баллов медианы или моды.
