- •Содержание
- •1 Введение в медицинскую
- •2 Этапы статистического
- •2.1 Цель и задачи исследования
- •2.2 План и программа статистического исследования
- •2.2.1 Статистическая совокупность, единица наблюдения, учетные признаки.
- •2.2.2 Программа сбора. Генеральная и выборочная совокупности. Репрезентативность данных. Ошибки репрезентативности.
- •2.2.3 Планирование эксперимента с малым числом наблюдений.
- •2.2.4 Программа разработки статистических
- •2.3 Основы работы с программой мs Ехсеl
- •2.3.1 Ввод и редактирование данных.
- •2.3.2 Выделение блока ячеек.
- •2.3.3 Ввод математических формул
- •2.3.4 Копирование данных
- •2.3.5 Дублирование формул
- •2.3.6 Формирование границ таблицы
- •2.4 Статистические таблицы.
- •2.4.1 Формирование статистических и сводных таблиц в мs Ехсеl
- •2.5 Графические изображения
- •2.5.1 Правила построения графических изображений (диаграмм)
- •2.5.2 Основные типы диаграмм
- •Петербурга в показателях наглядности
- •2.5.3 Специальные диаграммы
- •3 Относительные величины.
- •4 Основы математико-статистической обработки данных. Показатели описательной статистики
- •4.1 Ряды распределений. Вариационные ряды.
- •4.1.1 Построение вариационных рядов в мs Ехсеl
- •4.2.1 Среднее арифметическое и другие степенные средние
- •4.2.2 Мода и медиана
- •2.2.3 Вычисление среднего взвешенного и некоторых степенных средних в ms Excel
- •4.3 Показатели рассеяния вариант
- •4.3.1 Дисперсия
- •4.3.2 Среднеквадратическое отклонение
- •4.3.3 Коэффициент вариации
- •4.3.4 Квантили
- •4.3.5 Использование мs Ехсеl для нахождения квантилей
- •4.3.6 Статистические моменты. Асимметрия и эксцесс
- •4.5 Оценка статистических параметров по выборочным данным
- •4.5.1 Доверительная значимость, доверительная вероятность, доверительный интервал, доверительный предел
- •4.6 Вычисление показателей описательной статистики ms Excel
- •5 Теоретические распределения
- •5.2 Критерии совпадения эмпирических и теоретических распределений. Статистические оценки нормальности распределения
- •5.3 Нахождение нормального распределения с помощью мs Ехсеl
- •5.3.1 Критерий согласия Пирсона х2
- •5.3.2 Критерий согласия Колмогорова к()
- •6 Статистическая связь между признаками. Основные виды связи.
- •6.1 Оценка взаимосвязи количественных признаков
- •6.1.1 Регрессия
- •1. Элиминирование влияние третьего признака и выявление связи между первым и вторым производится по формуле:
- •6.3.1 Коэффициенты q и ф
- •6.3.2 Коэффициенты взаимной сопряженности Пирсона (с) и Чупрова (к)
- •6.3.3 Вычисление критерия сопряженности в мs Excel
- •6.3.4 Коэффициент ранговой корреляции Спирмена
- •7 Статистические критерии различия
- •7.1.1 Определение «выскакивающей» варианты с помощью м5 Ехсеl
- •7.5.1 Критерий знаков
- •8 Динамические (временные) ряды
- •9 Оценка различий показателей заболеваемости
- •195067, Санкт-Петербург, Писаревский пр., 47
6.3.3 Вычисление критерия сопряженности в мs Excel
Для удобства работы возьмём использованные в предыдущем примере данные (Таблица 68) и расположим их в таблице Excel следующим образом:
Рисунок 94
1 .Для того, что бы вычислить «теоретические» частоты в клетке с координатами А6 наберите формулу А$4*D$1$D$4/D. В этой формуле А4 - итог по столбцу А; D1 - итоги по первой строке; D4 -итоговая сумма. Знак $ используется для фиксации адреса при копировании. Напоминаем: все адреса указываются латинским шрифтом!
2.Скопируйте набранную формулу в область А6:С8. После копирования в этой области будут расположены «ожидаемые» частоты (Рисунок 95).
-
21,69811321
8,46226
15,84
26,88679245
10,4858
19,627
51,41509434
20,0519
37,533
Рисунок 95
3. Установите курсор в ячейку Е11 и занесите в неё функцию ХИ2ТЕСТ из меню «Вставка» и «Функция». В открывшемся окне укажите фактический интервал А1:СЗ, ожидаемый интервал А6:С8. Нажмите клавишу ОК.
4.
Для того что бы получить значение
коэффициента хи-квадрат в формуле
,
установите
курсор в позицию Е12. Затем
вызовите функцию ХИ20БР
и
укажите в соответствующих окнах
адрес вычисленной вероятности Е11 и
число степеней свободы
(3-1 )*(3-1)=4.
Значение критерия сопряженности вычисляется через функцию КОРЕНЬ. В окно введите выражение Е12/(Е12+04), где Е12 - адрес значения хи-квадрат, D4 адрес общего числа наблюдений.
Результаты, после введения поясняющих надписей, будут представлены в следующем виде:
Рисунок 96
6.3.4 Коэффициент ранговой корреляции Спирмена
В некоторых исследованиях приходится сталкиваться с ситуацией, когда учетные признаки характеризуются не точными числовыми значениями, а приближенными оценками, большего или меньшего количества какого-либо свойства или явления. Если отдельные единицы наблюдения расположить в порядке возрастания или убывания этих оценок, иначе ранжировать, то порядковый номер каждой единицы наблюдения, будет номером ее ранга. Если анализируемые признаки взаимосвязаны, изменения их числовых значений в большую или меньшую сторону будут совпадать, соответственно разность их рангов будет минимальна, и наоборот.
Одно из главных достоинств коэффициента корреляции рангов заключается в простоте вычислений. Применение этого коэффициента корреляции может быть рекомендовано в случаях:
- когда необходимо быстро, ориентировочно определить связь между какими то признаками;
- если необходимо оценить связь между качественными и количественными признаками или только между качественными признаками;
- когда распределение значений учетных признаков (в том числе и количественных не соответствует нормальному распределению или распределение неизвестно.
Существует
несколько вариантов вычислений
коэффициентов ранговой
корреляции. Коэффициент
корреляции рангов Спирмена
вычисляется
по
формуле:
,
где-разности
между рангами (порядковыми номерами),
n
– число сопоставляемых
пар. Например:
требуется
оценить зависнуть
интенсивности запаха
воды
(в баллах) открытого водоема (Y)
и удаленности места забора проб (в км)
от возможного источника загрязнения
(Х).
Таблица 69
Вычисление коэффициента корреляции рангов Спирмена
Х(км) |
Y (баллы) |
Ранги X |
Ранги Y |
d |
d2 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
1 |
6,5 |
-5,5 |
30,25 |
6 |
1 |
2 |
6,5 |
-4,5 |
20,25 |
5 |
2 |
3 |
4 |
-1 |
1 |
4 |
3 |
4 |
3 |
1 |
1 |
3 |
2 |
5 |
4 |
1 |
1 |
1 |
3 |
6,5 |
3 |
3,5 |
12,25 |
1 |
А |
6,5 |
1 |
5,5 |
30,25 |
|
Sd=0 |
Sd2=96 |
|||
Вычисления выполняются в следующей последовательности;
Располагаем значения X, ранжируя их в первом столбце таблицы по мере убывания.
В соседнем столбце располагаем соответствующие признаку Х значения Y. Специального ранжирования в этом столбце уже не проводится. Все значения во втором столбце располагаются только соответственно парным значениям X.
В третьем столбце выставляются ранги значений X. Самому большому значению Х=7 присваивается ранг 1. Следующему значению Х=6 присваивается ранг 2, и т.д. В конце ряда, на 6 и 7 месте имеется два одинаковых значения X. Этим значениям X присваивается средний ранг (6+7)/2-б,5.
В четвертом столбце таблицы размещаются ранги значений Y. Номера рангов выставляются, начиная от самых больших значений Y (так же, как и по ряду X). Самое большое значение Y=4 (в низу столбца) получает ранг 1. Затем идут значения Y=3. Они занимают 2 и 4 место (считая от самого большого значения Y=4) Соответственно им присваивается усредненное значение ранга (2+4)/2=3, и т.д.
5.
В пятом столбце записывается разность
рангов ряда Х и Y.
В
шестом - квадрат этой разности. Полученные
значения квадратов
суммируются и подставляются в формулу:
Таким образом, связь между интенсивностью запаха воды и удаленностью от возможного источника загрязнения можно считать доказанной.
