- •Лекционный комплекс
- •Лекция №1
- •3. Тезисы лекции:
- •5. Литература:
- •6. Контрольные вопросы:
- •Лекция №2
- •3. Тезисы лекции.
- •5. Литература:
- •6. Контрольные вопросы:
- •Лекция №3
- •3. Тезисы лекции.
- •5. Литература:
- •6. Контрольные вопросы:
- •Лекция №4
- •3. Тезисы лекции.
- •5. Литература:
- •6. Контрольные вопросы:
- •Лекция №5
- •3. Тезисы лекции.
- •I этап. Составление плана и программы
- •II этап. Сбор статистического материала (статистическое наблюдение).
- •III этап. Обработка собранного материала:
- •IV этап. Анализ полученных данных
- •5. Литература:
- •6. Контрольные вопросы
5. Литература:
Жижин К.С. Медицинская статистика: Учебное пособие/ - Ростов н/д: Феникс, 2007. - 160 с.
Петри А., Сэбин К. Наглядная медицинская статистика/ пер. с англ. под ред. В.П. Леонова. 2-е изд., перераб. и доп. - М.: ГЭОТАР-Медиа, 2009. - 168 с.
Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы. - М.: Издательство РАМН, 2000. - 52 с.
Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. - М.: МедиаСфера, 2002. - 312 с.
Рокицкий П.Ф. Биологическая статистика. Изд. 3-е, испр. Минск, «Высшая. школа», 1973. - 320 с.
http://www.biometrica.tomsk.ru
http://ru.wikipedia.org
6. Контрольные вопросы:
Что такое «биостатистика»?
Какова роль ученых Ф. Гальтона, К. Пирсона, Р. Фишера в развитии биометрики?
Что подразумевается под сбором статистических данных?
Лекция №2
1. Тема: Основы теории проверки статистических гипотез.
2. Цель: Ознакомить студентов с основами теории проверки статистических гипотез.
План лекции:
Статистические гипотезы, применительно к биостатистическим медико-биологическим исследованиям.
Доверительная вероятность, уровень значимости, мощность критерия. Алгоритм проверки статистических гипотез.
Критерии согласия χ2 Пирсона, Колмогорова – Смирнова.
t-критерий Стьюдента для анализа биомедицинских данных.
Непараметрические критерии проверки гипотез.
3. Тезисы лекции.
В прикладных задачах часто требуется по наблюдениям выборки высказать некоторое суждение (гипотезу) относительно интересующих экспериментатора характеристик генеральной совокупности, из которой эта выборка извлечена. То есть, речь идет о проверке статистических гипотез.
Гипотеза – это некоторое предположение о параметрах известных распределений (параметрическая) или о виде неизвестного закона распределения (непараметрическая) случайных величин, выдвигаемое в качестве предварительного, условного объяснения.
Генеральная статистическая совокупность – это совокупность элементов, которая состоит из бесконечно большого числа единиц.
Выборка или выборочная совокупность – это часть генеральной совокупности элементов, которая охватывается наблюдением.
Репрезентати́вность – это соответствие характеристик выборки характеристикам генеральной совокупности в целом. Она определяет, насколько возможно применить результаты исследования с привлечением определённой выборки для характеристики генеральной совокупности, из которой она была выбрана.
Виды репрезентативности выборки:
Качественная – соответствие признаков единиц наблюдения в выборочной и генеральной совокупностях.
Количественная – достаточное число наблюдений.
Объем выборки – это число случаев, включённых в выборочную совокупность.
Единица наблюдения – это каждый частный случай явления, которое изучается.
Основа выборочного метода исследования – это закон больших чисел, который характеризует тенденцию показателя выборочной совокупности при увеличении числа наблюдений максимально приближаться к генеральной совокупности.
Теория проверки статистических гипотез является основным инструментом доказательной, а не интуитивной медицины.
Задачи медицинских и биологических исследований, для решения которых необходимо сформулировать статистические гипотезы:
анализ соответствия распределения значений признака в изучаемой группе какому-либо определенному закону (анализ соответствия распределения нормальному закону);
сравнение групп по параметрам распределений признака (по средним значениям, дисперсиям).
Например, при проверке статистических гипотез можно получить ответ на следующий вопрос. В двух однородных группах больных гриппом была проведена вакцинация: одной лекрственным средством «А», а другой - «В», среднее время выздоровления в группах неодинаково. Указывает ли это обстоятельство на то, что одно противогриппозное средство по эффективности превосходит другое или же выявленное различие случайно?
Для решения любой подобной задачи выдвигаются две статистические гипотезы:
нулевая гипотеза Н0 - гипотеза об отсутствии различий между группами, либо об определенных значениях параметров, либо о соответствии распределения нормальному закону;
альтернативная гипотеза Н1 - гипотеза о существовании различий между группами, либо об отличающихся от заданных значениях параметров, либо о несоответствии распределения нормальному закону.
Нулевая гипотеза формулируется таким образом, чтобы она была противоположной той исследовательской (медицинской, биологической) гипотезе, которая послужила поводом для проведения исследования.
Для проверки нулевой гипотезы применяют статистические методы (тесты, критерии).
Статистика – это функция от выборочных наблюдений на основе которой принимается или отвергается нулевая гипотеза.
Статистическими критериями называются правила, согласно которым выясняется, соответствует или нет интересующая нас гипотеза опытным данным.
Статистические критерии - это наиболее широко применяемые статистические средства.
Значение критерия, которое рассчитано по выборочной совокупности, подчиняющейся определённому закону распределения, называется наблюдаемым.
Множество возможных значений статистического критерия, при которых основная гипотеза принимается, называется областью принятия.
Множество возможных значений статистического критерия, при которых основная гипотеза отвергается, называется критической областью.
Точки, разграничивающие критическую область и область принятия гипотезы, называются критическими точками.
В результате проверки статистических гипотез возникают следующие ситуации:
Н0 неверна и отклонена согласно статистическому критерию - истинноположительный результат;
Н0 верна, но ошибочно отклонена согласно статистическому критерию - ложноположительный результат (ошибка первого рода);
Н0 неверна, но ошибочно не отклонена согласно статистическому критерию - ложноотрицательный результат (ошибка второго рода);
Н0 верна и не отклонена согласно статистическому критерию - истинноотрицательный результат.
Возможные решения при различных соотношениях результатов статистического теста и истинной ситуации в генеральной совокупности
|
В генеральной совокупности |
||
Н0 не верна |
Н0 верна |
||
В статистическом тесте |
Н0 отклонена |
Истинно -положительный результат |
Ложно -положительный результат (ошибка первого рода) |
Н0 не отклонена |
Ложно -отрицательный результат (ощибка второго рода) |
Истинно -отрицательный результат |
|
Ошибка первого рода иначе называется уровнем статистической значимости.
Уровень значимости - это максимально приемлемая для исследователя вероятность ошибочно отклонить нулевую гипотезу, когда на самом деле она верна, т.е. допускаемая исследователем величина ошибки первого рода.
При иссследованиях в фармации, медицине и биологии используется величина уровня значимости, равная 0,05. При разработке стандартов используют уровень значимости равный 0,01.
Уровень значимости или вероятность ошибки первого рода обозначается через «р», а вероятность ошибки второго рода - через «γ».
Доверительная вероятность (γ) - это вероятность не совершить ошибку первого рода и принять верную гипотезу Н0 (γ=1-р).
Важнейшей характеристикой любого статистического критерия является его мощность. Мощностью критерия называется его способность правильно исключать ложную гипотезу.
Мощность оценивается вероятностью 1-γ, где γ - вероятность ошибки второго рода.
Функция, определяющая значения 1-γ в зависимости от указанных вероятностей и числа наблюдений, называется функцией мощности критерия. Эта функция позволяет выбрать подходящий критерий для практического использования, а также учитывается при разработке новых критериев.
Гипотеза Н0 |
Решение |
Вероятность |
Примечание |
Верна |
Принимается |
1-р |
Доверительная вероятность |
Отвергается |
р |
Вероятность ошибки первого рода |
|
Неверна |
Принимается |
γ |
Вероятность ошибки второго рода |
Отвергается |
1- γ |
Мощность критерия |
Алгоритм проверки статистических гипотез:
1) Выдвигаются две гипотезы: основная (нулевая) Н0 и альтернативная (конкурирующая) Н1.
2) Задается уровень значимости. Статистический вывод никогда не может быть сделан со стопроцентной уверенностью. Всегда допускается риск принятия неправильного решения.
При проверке статистических гипотез мерой такого риска является уровень значимости.
3) По исходным данным, т.е. по выборке, вычисляется наблюдаемое значение критерия.
4) По специальным статистическим таблицам определяется табличное, т.е. критическое, значение критерия.
5) Путем сравнения наблюдаемых и критических значений делается вывод о правильности той или иной гипотезы.
В биостатистике часто проверяются гипотезы о виде распределения случайной величины.
Соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями, называется законом распределения случайной величины.
Существуют различные законы распределения случайной величины (равномерный, биноминальный, экпонециальный, Пуассона, нормальный и др.).
Нормальный закон распределения (закон Гаусса) играет важную роль в биостатистике.
Во-первых, это наиболее часто встречающийся на практике закон распределения непрерывных случайных величин.
Во-вторых, он является предельным законом в том смысле, что к нему при определенных условиях приближаются другие законы распределения.
Нормальный закон распределения характеризуется формулой для плотности вероятности:
где х – возможное значение случайной величины «X»; µ или М(Х)- ее математическое ожидание; –среднее квадратическое отклонение.
Если случайная величина распределена по нормальному закону, то достаточно знать только два числовых параметра: µ и , чтобы полностью знать закон ее распределения.
График
функции называется нормальной кривой
распределения (кривой Гаусса). Он имеет
симметричный вид относительно
ординаты х=µ=М(Х).
Максимальная плотность вероятности,
равная
,
соответствует математическому ожиданию,
которое выражает среднее значение
М(Х)=
.
По
мере удаления от нее плотность
вероятности f(х)
уменьшается
и постепенно приближается к нулю.
Нормальное распределение случайной величины.
Множество биологических и медицинских показателей (показатели физического развития, составляющие плазмы крови и др.), а также ошибки их измерения подчиняются нормальному распределению.
Поэтому важно уметь проверять гипотезы о параметрах нормально распределенных случайных величин.
Все предположения о характере того или иного распределения - являются гипотезами. Поэтому они должны подвергаться статистической проверке с помощью критериев согласия. Эти критерии дают возможность определить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными, т.е. случайными, а когда – существенными, т.е. неслучайными.
Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду.
Наиболее распространенными критериями согласия являются критерии χ2-Пирсона и Колмогорова-Смирнова.
1. Критерий согласия χ2 -Пирсона.
Критерий Пирсона применяется в двух случаях:
для сопоставления расчетного распределения признака с теоретическим распределением (нормальным, экспоненциальным, равномерным и т.д.);
для сопоставления двух расчетных распределений одного и того же признака.
Цель
метода -
определение степени расхождения
соответствующих частот
,
т.е.,
чем больше
это расхождение, тем больше значение
χ2расч.
Пусть х1,х2,…,хn - выборка наблюдений случайной величины «Х». Проверяется гипотеза Н0, утверждающая, что случайная величина «Х» имеет функцию распределения F(x).
Формула
критерия χ2:
,
где
k
- число групп,
на которое разбито эмпирическое
распределение, υi
- наблюдаемая
частота признака в i-й
группе,
-
теоретическая частота.
Для распределения χ2 составлены таблицы. В которых указано критическое значение критерия согласия χ2кр для выбранного уровня значимости «р» и степеней свободы «f».
Число степеней свободы находят по равенству f=s-1-r, где s - число групп выборки, r - число параметров предполагаемого распределения.
Например, если предполагаемое распределение – нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому r=2 и число степеней свободы f=s-1-2=s-3.
Если
<
,
то при заданном уровне значимости и
числе степеней свободы нет оснований
отвергнуть гипотезу «H0».
Если ≥ , то при заданном уровне значимости и числе степеней свободы гипотезу «H0» отвергают и принимают гипотезу «Н1».
Критерий согласия Пирсона применяется, если объем совокупности достаточно велик N≥50, при этом частота каждой группы должна быть не менее пяти.
2. Критерий согласия Колмогорова - Смирнова.
Пусть х1,х2,…,хn – выборка наблюдений случайной величины «Х». Проверяется гипотеза «Н0», утверждающая, что случайная величина «Х» имеет определенный закон распределения.
В
данном критерии при расчете расхождения
между теоретическим и наблюдаемым
распределениями применяют
максимальное значение абсолютной
величины разности между наблюдаемой
частотой
υi
и
соответствующей теоретической частотой
:
dmax=
Формула
критерия:
,
где N - число наблюдений в статистическом ряду.
При уровне значимости р=0,05 λкр=1,36.
Если
≤
,
то при заданном уровне значимости нет
оснований отвергнуть гипотезу H0.
Если > , то при заданном уровне значимости гипотезу H0 о предполагаемом распределении отвергают и принимают гипотезу Н1.
Критерий Колмогорова-Смирнова применяется при достаточно большом числе наблюдений (N≥50).
t-критерий Стьюдента – это метод проверки однородности выборок. Он позволяет принять или отвергнуть гипотезу о равенстве средних значений двух выборок.
Основные условия применимости критерия Стьюдента:
рассматриваемые выборки имеют нормальное распределение;
дисперсии выборок равны.
Критерий Стьюдента может применяться при малых выборках (n1,2≤30).
Два случая использования t-критерия Стьюдента:
При проверке гипотезы о равенстве средних значений двух независимых выборок (двухвыборочный t-критерий).
В этом случае анализируются контрольная и экспериментальная (опытная) выборки разных объемов.
При проверке гипотезы о равенстве средних двух зависимых выборок (парный t-критерий).
В этом случае анализируется одна и та же выборка до и после эксперимента.
П
орядок
применения двухвыборочного
t-критерия
Стьюдента:
Н
0:
Н1:
2. р=0,05
3
.
где
n1,
n2
- объемы рассматриваемых выборок,
-
дисперсии рассматриваемых выборок,
-
сравниваемые средние значения
выборок,
n1+n2-1=f
- степень свободы.
4.
.
5
.
Если
<
,
то различия между средними значениями
данных не являются статистически
значимыми, т.е.
нулевая гипотеза (Н0:
) принимается.
Если > , то различия между средними значениями данных являются статистически значимыми, т.е. нулевая гипотеза отвергается.
П орядок применения парного t-критерия:
Н 0:
Н1:
2. р=0,05
3
.
где
- разности
между соответствующими значениями пар
переменных,
-
среднее значение
этих
разностей, n
- объем выборки,
n-1=f
- степень свободы.
.Е сли < , то различия между средними значениями данных не являются статистически значимыми, т.е. нулевая гипотеза (Н0: ) принимается.
Если > , то различия между средними значениями данных являются статистически значимыми, т.е. нулевая гипотеза отвергается.
Статистические критерии делятся на параметрические и непараметрические.
Параметрические критерии - статистические критерии, предполагающие наличие нормального распределения переменных, которые измеряются на шкале интервалов или отношений (например, t-критерий Стьюдента, χ2 Пирсона).
Непараметрические критерии - критерии, которые не рассматривают анализируемое статистическое распределение как функцию, их применение не предполагает предварительного вычисления параметров распределения (например, критерий Манна-Уитни, критерий Уилкоксона, критерий знаков).
Эти критерии сопоставляют не сами по себе полученные величины, а порядок (ранг) их расположения, их соотношение по типу больше-меньше.
Применимость непараметрических критериев именно к порядковым (а не строго количественным) показателям выступает их серьезным преимуществом перед критериями параметрическими. Это особенно важно для измерений в медицине.
Кроме того, непараметрические критерии не требуют анализа формы распределения, т.е. не рассчитаны только лишь на нормальное распределение, хотя и в его условиях дают надежные результаты.
В математической статистике для различных приложений создано большое количество параметрических и непараметрических критериев, многие из которых маломощны или не определены по мощности.
Поэтому в медицинских приложениях лучше пользоваться сравнительно небольшим набором основных критериев, наиболее мощных в большинстве случаев.
4. Иллюстративный материал: презентация, слайды.
