Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
гипотезы.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
28.12 Кб
Скачать

Статистические гипотезы

Любое исследование начинается с формирования статистической гипотезы. Оговариваются особенности статистических закономерностей при получении результатов эксперимента, анализируется допустимость распространения результатов отдельных выборок на всю генеральную совокупность.

Наиболее частыми задачами медицинских и биологических исследований, для решения которых оказывается необходимым сформулировать статистические гипотезы, являются следующие:

- анализ соответствия распределений значений признака в изучаемой группе какому-либо определенному закону;

- сравнение групп по параметрам распределения признака (например, по средним, дисперсиям)

В медицинской статистике различают следующие виды гипотез:

Н0 – нулевая, гипотеза об отсутствии различий, изменений, эффектов воздействия на совокупность, либо гипотеза об отсутствии различий между группами, либо гипотеза об определенных значениях параметров, либо гипотеза о соответствии распределения нормальному закону;

На – альтернативная, гипотеза о наличии различий, изменений, эффектов при воздействии на совокупность, либо гипотеза о существовании различий между группами, либо гипотеза об отличающихся от заданных значений параметров, либо гипотеза о несоответствии распределения нормальному закону.

Редко, но гипотеза может включать и более двух возможных вариантов решения.

В подавляющем большинстве случаев в медико-биологическом исследовании исследователи пытаются выявить различия в уровне, динамике, характере распределения показателей в экспериментальной и контрольной группах испытуемых.

Обычно нулевая гипотеза формулируется таким образом, чтобы она была противоположна той исследовательской гипотезе, которая послужила поводом для поведения исследования.

При проверке гипотез используются:

  1. Параметрические методы, требующие знания законов распределения вероятностей, как в выборке, так и в генеральной совокупности.

  2. Непараметрические методы, не требующие знания законов распределения вероятностей ни в выборке, ни в генеральной совокупности.

При проверке гипотез возникают следующие ситуации, представленные в таблице 1. В результате принятия (отклонения) гипотезы возникает риск совершения ошибок первого и второго рода. Ошибка первого рода появляется, если отвергается верная гипотеза, например отвергается верная гипотеза Н0. Ошибка второго рода возникает, когда принимается неверная гипотеза, например, нулевая гипотеза Н0 оценивается как ложная.

Таблица 1

Возможные решения при различных соотношениях результатов теста и истинной ситуации в генеральной совокупности

В генеральной совокупности

Н0 неверна

Н0 верна

В статистическом тесте

Н0 отклонена

Истинно-положительный результат

Ложно-положительный результат

Н0 не отклонена

Ложно-отрицательный результат

Истинно-отрицательный результат

Если обозначить вероятность ошибки первого рода как , а вероятность ошибки второго рода как , то значения вероятности правильного вывода в первом случае будет равным р=1- .. Значение р – это рассчитанная в ходе статистического теста вероятность ошибочного отклонения нулевой гипотезы, или это вероятность получить данные анализируемых выборок в случае справедливости нулевой гипотезы, или это вероятность справедливости нулевой гипотезы. Значения р могут быть выражены как 0,95 или 0,05 (0,99 или 0,01; 0,999 или 0,001) и называются уровнем значимости.

Метод проверки статистических гипотез заключается в сравнении полученного значения р с принятым уровнем значимости:

- если рассчитанное в тесте значение р>0,05, то нулевую гипотезу не отклоняют;

- если рассчитанное в тесте значение р<0,05, то нулевую гипотезу отклоняют и принимают альтернативную гипотезу На. При этом различия групп называют статистически значимыми.

Величина -ошибки зависит от величины ожидаемого эффекта и объема выборки. Часто величина задается значением 0,2 (20%). С учетом допустимого уровня этого параметра существует возможность рассчитать объем выборки, необходимый для выявления эффекта определенной величины. Ошибки второго рода непосредственно влияют на мощность критерия при проверке гипотезы, когда велика вероятность не совершить ошибки второго рода.

В целом ряде случаев полученный отрицательный результат – тоже результат, поэтому вероятность и значимость ошибок первого рода значительно выше, чем ошибок второго рода.

Ошибка первого рода существенна в конфирматорном (уточняющем) эксперименте, а так же тогда, когда неприятие верной гипотезы об отсутствии различий имеет практическую значимость (принятие ложной гипотезы об эффективности препарата может иметь катастрофические последствия)

Ошибка второго рода существенна в эксплораторном (разведочном) эксперименте. Отклонение гипотезы о различиях на начальной стадии эксперимента может (в лучшем случае!) неверно ориентировать исследователя на перспективу.

Чем меньше величина р, тем менее вероятна справедливость нулевой гипотезы, однако эта величина никак не отражает величину различий между группами. Именно поэтому получил широкое распространение подход, основанный на построении и сравнении ДИ для оценки различий между группами и изменений в одной группе во времени.

Два упомянутых подхода сравнения групп – проверка статистической гипотезы и сравнение ДИ – основаны на одних и тех же статистических моделях и предположениях. Но, поскольку ДИ имеет такие же единицы измерения, что и изучаемый признак (в отличие от безразмерной величины р), интерпретация сопоставления выборок с использованием ДИ легче, чем при статистической проверке гипотез. Значение р обычно интерпретируется либо как статистически значимый (позитивный), либо как статистически незначимый (негативный) результат, то ДИ позволяет интерпретировать значения изменений на любом конце ДИ (например, если один конец ДИ содержит клинические важные значения, а другой – нет, результаты могут быть оценены как неоднозначные). По этим причинам ДИ предпочтительнее, чем р, но так как построение ДИ возможно не всегда, то проверка статистических гипотез с помощью статистических критериев, остается основным подходом при сравнении групп.

Если признак определен как количественный, то задача исследователя заключается в том, чтобы становить, является ли его распределение нормальным (гауссовым). Лишь 20% распределений количественных признаков, встречающихся в медико-биологических исследованиях, являются приближенно нормальными. Проверка нормальности важна еще и по другой причине: нормальное распределение возникает в том случае, когда вариабельность значений этого признака обусловлена влиянием множества причин, вклад каждой в отдельности минимален. Для конкретного признака это означает его взаимосвязь со многими подсистемами организма (психики), а не с одной-двумя из них.