- •Содержание
- •1 Введение в медицинскую
- •2 Этапы статистического
- •2.1 Цель и задачи исследования
- •2.2 План и программа статистического исследования
- •2.2.1 Статистическая совокупность, единица наблюдения, учетные признаки.
- •2.2.2 Программа сбора. Генеральная и выборочная совокупности. Репрезентативность данных. Ошибки репрезентативности.
- •2.2.3 Планирование эксперимента с малым числом наблюдений.
- •2.2.4 Программа разработки статистических
- •2.3 Основы работы с программой мs Ехсеl
- •2.3.1 Ввод и редактирование данных.
- •2.3.2 Выделение блока ячеек.
- •2.3.3 Ввод математических формул
- •2.3.4 Копирование данных
- •2.3.5 Дублирование формул
- •2.3.6 Формирование границ таблицы
- •2.4 Статистические таблицы.
- •2.4.1 Формирование статистических и сводных таблиц в мs Ехсеl
- •2.5 Графические изображения
- •2.5.1 Правила построения графических изображений (диаграмм)
- •2.5.2 Основные типы диаграмм
- •Петербурга в показателях наглядности
- •2.5.3 Специальные диаграммы
- •3 Относительные величины.
- •4 Основы математико-статистической обработки данных. Показатели описательной статистики
- •4.1 Ряды распределений. Вариационные ряды.
- •4.1.1 Построение вариационных рядов в мs Ехсеl
- •4.2.1 Среднее арифметическое и другие степенные средние
- •4.2.2 Мода и медиана
- •2.2.3 Вычисление среднего взвешенного и некоторых степенных средних в ms Excel
- •4.3 Показатели рассеяния вариант
- •4.3.1 Дисперсия
- •4.3.2 Среднеквадратическое отклонение
- •4.3.3 Коэффициент вариации
- •4.3.4 Квантили
- •4.3.5 Использование мs Ехсеl для нахождения квантилей
- •4.3.6 Статистические моменты. Асимметрия и эксцесс
- •4.5 Оценка статистических параметров по выборочным данным
- •4.5.1 Доверительная значимость, доверительная вероятность, доверительный интервал, доверительный предел
- •4.6 Вычисление показателей описательной статистики ms Excel
- •5 Теоретические распределения
- •5.2 Критерии совпадения эмпирических и теоретических распределений. Статистические оценки нормальности распределения
- •5.3 Нахождение нормального распределения с помощью мs Ехсеl
- •5.3.1 Критерий согласия Пирсона х2
- •5.3.2 Критерий согласия Колмогорова к()
- •6 Статистическая связь между признаками. Основные виды связи.
- •6.1 Оценка взаимосвязи количественных признаков
- •6.1.1 Регрессия
- •1. Элиминирование влияние третьего признака и выявление связи между первым и вторым производится по формуле:
- •6.3.1 Коэффициенты q и ф
- •6.3.2 Коэффициенты взаимной сопряженности Пирсона (с) и Чупрова (к)
- •6.3.3 Вычисление критерия сопряженности в мs Excel
- •6.3.4 Коэффициент ранговой корреляции Спирмена
- •7 Статистические критерии различия
- •7.1.1 Определение «выскакивающей» варианты с помощью м5 Ехсеl
- •7.5.1 Критерий знаков
- •8 Динамические (временные) ряды
- •9 Оценка различий показателей заболеваемости
- •195067, Санкт-Петербург, Писаревский пр., 47
7 Статистические критерии различия
Статистический анализ различий является одной из коренных задач медико-биологических исследований. Например: характеристика эффективности фармакологического препарата или оценка неблагоприятного гигиенического фактора складывается из статистических оценок различий каких-либо физиологических параметров подопытных и контрольных групп лабораторных животных, различий всевозможных клинических вариантов течения заболевания и его исходов, различий показателей здоровья разных профессиональных групп разных групп населения и т.п.
Для того чтобы получить исчерпывающий ответ при решении такого рода задач, необходимо ответить на вопросы, которые на первый взгляд не являются напрямую связанными с оценкой различий:
Относится та или иная варианта к данной статистической совокупности?
Соответствует ли полученное распределение тому или иному теоретическому распределению?
Соответствует ли полученное распределение другому эмпирическому (опытному) распределению?
Являются ли конкретные выборочные группы наблюдения выборками из одной и той же генеральной совокупности?
Необходимость решения первого вопроса диктуется сильной вариабельностью данных медико-биологических исследований. Существенные, экстремальные отклонения вариант от среднего значения нередко вызывают сомнения, действительно ли та или иная варианта относится к конкретной группе или она включена в группу ошибочно. Более того, нередко встречается ситуация, когда именно из-за этих, так называемых «выскакивающих вариант», создается впечатление существенных различий сравниваемых групп.
Ответ на второй вопрос позволяет обосновать выбор того или иного метода статистического анализа данных, в том числе и выбор метода оценки различий.
Решение третьего вопроса дает ответ о различиях исследуемых групп. Следует отметить, что средние величины, ошибки средних, дисперсии и т.п. чаще всего не являются конечной целью статического исследования, а являются лишь статистическими параметрами, с помощью которых изучается вопросе» различиях групп.
Ответ на четвертый вопрос решает ключевую проблему всех выборочных наблюдений, которые представляются основными в медико-биологических исследованиях: действительно ли различаются выборочные группы или различия, которые на первый взгляд есть, объясняются просто обычной вариабельностью исходных данных одной генеральной совокупности?
Нетрудно заметить, что по существу все три вопроса сводятся к одному: являются ли наблюдаемые различия отражением объективно существующей реальности. Указанный вопрос решается проверкой соответствующих статистических гипотез.
7.1 Принадлежность варианты к совокупности
Принадлежность варианты к конкретной совокупности решается довольно просто, если объем наблюдения достаточно велик. В этом случае крайние варианты (очень большие или очень маленькие, часто называемые экстремальными вариантами или « выбросами»), а именно они вызывают сомнения относительно своей принадлежности к статистической совокупности, просто отбрасывают. Это вполне допустимо, ибо в большой совокупности роль («относительный вес») нескольких крайних вариант при вычислении средних величин, как правило, весьма незначителен. Выборка, оставшаяся после этой операции, называется «цензурирования выборка».
Если
же выборка мала, то потеря даже одной
варианты может исказить
результат всех последующих вычислений.
При такой ситуации
решение вопроса о принадлежности
варианты к совокупности
не представляет сложности, если
распределение в этой совокупности
является нормальным. Для этого достаточно
использовать
правило трех сигм. Согласно этому
правилу в пределах М±3σ
находится
99,7% всех вариант. Поэтому, если варианта
попадает в этот интервал, то она считается
принадлежащей к данной совокупности.
Если не попадает, то ее нужно отбросить.
Например:
требуется
определить правомерность включения в
нормально распределенный
вариационный ряд варианты 58 кг, если
среднее арифметическое
этого ряда М=40 кг, а σ=2,5 кг. Согласно
правилу трех сигм,
в пределах 40±3*2,5 кг или от 47,5 до 32,5 кг
должно находится 99,7 всех вариант.
Варианта 58 кг явно не попадает в этот
интервал.
Таким образом, с высокой степенью
вероятности можно утверждать,
что данная варианта не относится к
указанному ряду. Рассмотренная
выше методика определения «выскакивающих»
вариант
неудобна для практического использования.
Во-первых, она
требует предварительных расчетов
среднего арифметического
и сигмы (среднеквадратического
отклонения). Во-вторых, требует
пересчета этих показателей после
отброса «выскакивающих» вариант.
Более простой способ решения вопроса
о принадлежности вариант связан с
использованием величин
для наибольшей варианты и
для наименьшей варианты. Критические
значения с учетом уровней значимости
приводятся
в специальной таблице (См. Приложение).
Например:
задана
совокупность
V1=45,
V2=55,
\/з=58, 1 V4=62,
V5=64
. Вызывает
сомнение
правомерность включения в этот ряд
варианты V1=45.
По
приведенной формуле имеем
.
При числе
наблюдений n=5
и уровне значимости Р=0,01, τ =0,92. Поскольку
вычисленное значение показателя меньше
табличного (теоретического),
варианту V1=45
отбросить нельзя.
При использовании приведенных здесь методик, следует помнить, что они основаны на нормальности распределения. В ситуации, когда распределение вариант отличается от нормального, например, если асимметрия и эксцесс больше 0,5, эти оценки применять нельзя.
