- •Содержание
- •1 Введение в медицинскую
- •2 Этапы статистического
- •2.1 Цель и задачи исследования
- •2.2 План и программа статистического исследования
- •2.2.1 Статистическая совокупность, единица наблюдения, учетные признаки.
- •2.2.2 Программа сбора. Генеральная и выборочная совокупности. Репрезентативность данных. Ошибки репрезентативности.
- •2.2.3 Планирование эксперимента с малым числом наблюдений.
- •2.2.4 Программа разработки статистических
- •2.3 Основы работы с программой мs Ехсеl
- •2.3.1 Ввод и редактирование данных.
- •2.3.2 Выделение блока ячеек.
- •2.3.3 Ввод математических формул
- •2.3.4 Копирование данных
- •2.3.5 Дублирование формул
- •2.3.6 Формирование границ таблицы
- •2.4 Статистические таблицы.
- •2.4.1 Формирование статистических и сводных таблиц в мs Ехсеl
- •2.5 Графические изображения
- •2.5.1 Правила построения графических изображений (диаграмм)
- •2.5.2 Основные типы диаграмм
- •Петербурга в показателях наглядности
- •2.5.3 Специальные диаграммы
- •3 Относительные величины.
- •4 Основы математико-статистической обработки данных. Показатели описательной статистики
- •4.1 Ряды распределений. Вариационные ряды.
- •4.1.1 Построение вариационных рядов в мs Ехсеl
- •4.2.1 Среднее арифметическое и другие степенные средние
- •4.2.2 Мода и медиана
- •2.2.3 Вычисление среднего взвешенного и некоторых степенных средних в ms Excel
- •4.3 Показатели рассеяния вариант
- •4.3.1 Дисперсия
- •4.3.2 Среднеквадратическое отклонение
- •4.3.3 Коэффициент вариации
- •4.3.4 Квантили
- •4.3.5 Использование мs Ехсеl для нахождения квантилей
- •4.3.6 Статистические моменты. Асимметрия и эксцесс
- •4.5 Оценка статистических параметров по выборочным данным
- •4.5.1 Доверительная значимость, доверительная вероятность, доверительный интервал, доверительный предел
- •4.6 Вычисление показателей описательной статистики ms Excel
- •5 Теоретические распределения
- •5.2 Критерии совпадения эмпирических и теоретических распределений. Статистические оценки нормальности распределения
- •5.3 Нахождение нормального распределения с помощью мs Ехсеl
- •5.3.1 Критерий согласия Пирсона х2
- •5.3.2 Критерий согласия Колмогорова к()
- •6 Статистическая связь между признаками. Основные виды связи.
- •6.1 Оценка взаимосвязи количественных признаков
- •6.1.1 Регрессия
- •1. Элиминирование влияние третьего признака и выявление связи между первым и вторым производится по формуле:
- •6.3.1 Коэффициенты q и ф
- •6.3.2 Коэффициенты взаимной сопряженности Пирсона (с) и Чупрова (к)
- •6.3.3 Вычисление критерия сопряженности в мs Excel
- •6.3.4 Коэффициент ранговой корреляции Спирмена
- •7 Статистические критерии различия
- •7.1.1 Определение «выскакивающей» варианты с помощью м5 Ехсеl
- •7.5.1 Критерий знаков
- •8 Динамические (временные) ряды
- •9 Оценка различий показателей заболеваемости
- •195067, Санкт-Петербург, Писаревский пр., 47
5.3.1 Критерий согласия Пирсона х2
Для оценивания меры соответствия (расхождения) полученных эмпирических данных и каких либо теоретических распределений применяются различные статистические критерии. Критерии, которые используют с этой целью, называются критериями согласия.
В наиболее общем виде критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели.
Среди критериев согласия большое распространение получил непараметрический критерий К.Пирсона-критерий 2 (хи-квадрат). Одной из причин такой популярности является возможность его использования с различными формами распределений совокупностей. Как и любой другой статистический критерий, он не доказывает справедливость нулевой гипотезы, а лишь устанавливает с определенной вероятностью ее согласие или несогласие с данными наблюдений. Величина критерия 2 -есть величина случайная, так как в различных опытах она принимает неизвестные заранее значения. Не вдаваясь в математическое описание причин, следует отметить, что при п распределение этой случайной величины стремится к закону распределения 2 с k степенями свободы. Поэтому критерий и назван по названию закона теоретического распределения % -критерий 2 (хи-квадрат).
Вычисление критерия 2 (хи-квадрат) на конкретных данных представлено в таблице.
Таблица 53
Пример вычисления критерия 2
Вес детей (кг)
|
Частоты (число детей) |
Объединенные частоты |
Р-Р
|
(Р-Р2) |
||
Эмпирич Р |
Теоретич. Р |
Эмпирич Р |
Теоретич. Р |
Р' |
||
21 |
2 |
1,4 |
|
|
|
|
22 |
9 |
4.9 |
11 |
6,3 |
4,7 |
0,36 |
23 |
6 |
11.1 |
6 |
11,1 |
-5,1 |
0,41 |
24 |
11 |
16,1 |
11 |
16,1 |
-5,1 |
0,41 |
25 |
18 |
14.9 |
18 |
14,9 |
3,1 |
0,15 |
26 |
15 |
9,9 |
16 |
13,6 |
2,4 |
0,09 |
27 |
1 |
3.7 |
|
|
|
|
Итого |
62 |
62 |
62 |
62 |
|
1,42 |
Условием применения этого метода является наличие не менее 5 наблюдений (частот) в каждой группе вариант. Для того, что бы это условие выполнялось, необходимо объединить малые частоты (в таблице объединенные частоты). После этого, значения критерия вычисляются в следующей последовательности:
Вычисляется разность между частотами эмпирических Рj и теоретических Рj распределений.
Чтобы погасить отрицательные значения этой разности она возводится в квадрат (Рj - Рj)2. Для уменьшения числового размера результата, разность делится на величину эмпирических частот
.
В целом, 2
(хи-квадрат)
тем мeньше,
чем меньше различаются эмпирические
и теоретические
частоты.
Число степеней свободы k, которое необходимо знать для определения справедливости нулевой гипотезы, устанавливаетcя в зависимости от вида распределения. При биноминальном (Пуассоновом) распределении k=S-2, при нормальном k=S-3. Где 5-число групп вариант. С учетом объединения групп, k=5-3=2.
Полученное значение критерия сравнивают с табличным или, найденным с помощью компьютера, теоретическим значением при заданном уровне значимости. В случае, когда вычисленный критерий больше табличного (теоретического) значения критерия 2 , нулевая гипотеза, которая предполагает соответствие эмпирического и теоретического распределений, отвергается.
Способом определения достоверности различий распределений, с помощью которого можно выполнять оценку вручную и без использования таблиц, является оценка 2по правилу Романовского или по формуле Б.С. Ястремского.
По
Романовскому нулевая гипотеза
отвергается, если неравенство
.
В данном примере
.
Следовательно, опытное, эмпирическое
распределение не отличается от
нормального.
По
Ястремскому нулевая гипотеза отвергается,
если выполняется неравенство
,
где 0
- поправка
на число
групп вариант. При К<20
она
равна 0,6. Подставляя значения
из примера, получаем
, что также не
позволяет отвергнуть нулевую гипотезу.
Следует отметить, что критерий 2, как критерий согласия обладает существенным недостатком. Он не позволяет иногда обнаружить реально существующие различия, поскольку некоторые скрадывает» группировка, которая осуществляется исследователем входе начальной подготовки рядов распределений к анализу.
В ряде случаев ориентировочную оценку расхождения или совпадений распределений позволяет давать графический метод.
Рисунок 75.Соотношение теоретического и эмпирического распределений.
На представленной диаграмме эмпирическое распределение дано в виде гистограммы, а теоретическое - в виде кривой распределения.
Другие методики вычисления критериях Х2, которые могут использоваться для решения задач оценки согласия распределений, представлены в разделах: «Оценка различий эмпирических распределений с помощью Ехсеl», «Коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К)», а также «Вычисление критерия сопряженности в МS Ехсеl»
