Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
osnovy_statistiki.doc
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
4.7 Mб
Скачать

Тема 5. Непараметрические методы оценки достоверности результатов статистического исследования. Критерий соответствия (хи-квадрат)

ЦЕЛЬ ЗАНЯТИЯ: Освоить методику вычисления и использования критерия соответствия для определения достоверности расхождения между несколькими сравниваемыми группами изучаемых явлений.

Методика проведения занятия: Студенты самостоятельно готовятся к практическому занятию по рекомендованной литературе и выполняют индивидуальное домашнее задание. Преподаватель в течение 10 минут проверяет правильность выполнения домашнего задания и указывает на допущенные ошибки, проверяет степень подготовки с использованием тестирования и устного опроса. Затем студенты самостоятельно вычисляют критерий соответствия для определения достоверности расхождения между несколькими сравниваемыми группами изучаемых явлений, оценивают полученные данные и формулируют заключение. В конце занятия преподаватель проверяет самостоятельную работу студентов.

КОНТРОЛЬНЫЕ ВОПРОСЫ:

  1. Когда применяется показатель соответствия «хи-квадрат»?

  2. На чем основан расчет показателя χ2?

  3. Что такое «нулевая гипотеза»?

  4. Из каких этапов складывается исчисление критерия соответствия «хи-квадрат»?

  5. Как определяется число степеней свободы при расчете критерия соответствия?

  6. Как оценивается полученный результат показателя соответствия?

  7. Когда различия между несколькими сравниваемыми группами оцениваются как существенные?

Краткое содержание темы:

Непараметрическими являются количественные методы статистической обработки данных, применение которых не требует знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.

Описанные выше статистические критерии достоверности (критерий Стьюдента t, критерий Фишера F и др.) относятся к параметрическим, т. к. используют стандартные параметры распределений (М, Р, m, n). Они связаны с законом нормального распределения и применяются для оценки расхождения между генеральными параметрами по выборочным показателям сравниваемых совокупностей. Существенным достоинством параметрических критериев служит их большая статистическая мощность, т. е. широкие разрешающие возможности, а недостатком – трудоемкость расчетов, неприменимость к распределениям, сильно отклоняющимся от нормального, а также при исследовании качественных признаков.

Наряду с параметрическими критериями для ориентировочной оценки расхождений между выборками (особенно небольшими) применяются так называемые непараметрические критерии, что позволяет сравнивать выборки как по количественным, так и по качественным признакам, значения которых не имеют числового представления, но которые можно ранжировать. Конструкции непараметрических критериев отличаются простотой.

В медицине для доказательства некоторого утверждения часто применяют метод, известный в математике как «доказательство от противного». Для этого в качестве рабочего инструмента используют так называемую «нулевую гипотезу». Гипотеза, в соответствии с которой отсутствуют различия между различными совокупностями, называется нулевой гипотезой.

Например, если надо показать, что заболеваемость в целом ниже у лиц, занимающихся физкультурой и спортом, чем у ведущих малоподвижный образ жизни, то выдвинем гипотезу об отсутствии различий в их состоянии здоровья. Затем попробуем отвергнуть эту гипотезу.

«Нулевая гипотеза» широко используется при оценке достоверности различия сравниваемых групп по критерию соответствия (хи-квадрат).

Критерий соответствия χ2 применяется для статистической оценки закона распределения эмпирических вариационных рядов и для доказательства достоверности различий между двумя или несколькими выборочными совокупностями. Критерий соответствия применяется, когда результаты исследования представлены абсолютными величинами, и результат исхода имеет много градаций (выздоровел, состояние улучшилось, ухудшилось, умер), а также, если в подлежащем имеется несколько признаков (несколько возрастных групп, несколько методов лечения, кормления и т.д.). Критерий основан на предположении (нулевой гипотезе) об отсутствии разницы между величинами, полученными в результате выборочного наблюдения и теоретически вычисленными. Чем больше фактические величины отличаются от ожидаемых, тем больше уверенность, что изучаемый фактор оказывает существенное влияние.

Вычисляется критерий соответствия по формуле χ2 =

Первым этапом в вычислении критерия соответствия являются формулировка нулевой гипотезы и исчисление ожидаемых величин. При определении ожидаемых чисел рекомендуется для большей точности расчета χ2 вычислять их до десятых. На следующем этапе определяется разность между фактическими и ожидаемыми числами по всем группам (φ – φ1). Затем определяют квадрат разностей (φ – φ1)2 и делят его на ожидаемое число в каждой группе . Критерий соответствия определяется путем суммирования всех предыдущих результатов по всем группам. Полученную величину χ2 оцениваем по таблице критических значений (приложение 3), для чего определяют число степеней свободы n = (S – 1)(R – 1), где S – число строк, R – число рядов. Нулевая гипотеза подтверждается, если χ2 меньше критического (табличного значения), и опровергается, если полученная величина χ2 равна или больше табличного значения (приложение, табл. 4).

Пример расчета критерия соответствия (табл. 4).

1 этап – формулируем нулевую гипотезу – введение противогриппозной вакцины не повлияло на заболеваемость гриппом. В этом случае распределение на заболевших и не заболевших в двух группах наблюдения должно быть одинаковым и соответствовать итоговому распределению. Из 94 человек не заболел 61, а из 73 вакцинированных сколько могло быть не заболевших, если бы вакцинация не влияла на заболеваемость?

=47,4

Ожидаемое число заболевших среди вакцинированных будет определяться по пропорции:

= =25,6

Так же вычисляются ожидаемые величины для заболевших и не заболевших гриппом из числа не вакцинированных.

= = 13,6 = = 7,4

Таблица 4

Влияние введения противогриппозной вакцины на заболеваемость гриппом

Число вакцинированных

Фактические числа ( )

Ожидаемые числа ( )

(φ – φ1)

(φ – φ1)2

Не заболело

Заболело

Не заболело

Заболело

Не заболело

Заболело

Не заболело

Заболело

Не заболело

Заболело

Вакцинированы

73

54

19

47,4

25,6

+6,6

-6,6

43,56

43,56

0,9

1,7

Не вакцинированы

21

7

14

13,6

7,4

-6,6

+6,6

43,56

43,56

3,2

5,9

всего

94

61

33

Σ=11,7

Затем определяется разность между фактическими и ожидаемыми числами (φ – φ1) = 54 – 47,4=+6,6; 19 – 25,6 = - 6,6 и т.д.

Результаты возводятся в квадрат, и каждый из них делится на ожидаемое число в группе.

и т.д.

χ2 определяется путем суммирования полученных результатов.

χ2 = 0,9 + 1,7 + 3,2 + 5,9 = 11,7

Для оценки критерия соответствия χ2 учитывается число рядов (R) и число строк (S) распределения фактических чисел (без итоговых), и на основании этих данных вычисляют так называемое число степеней свободы n = (R -1)×(S-1). Полученную величину χ2 оценивают по специальной таблице критических значений критерия соответствия χ2 (хи-квадрат). Для того, чтобы опровергнуть «нулевую гипотезу», вычисленный критерий соответствия должен быть равен или больше табличного (критического) значения при уровне вероятности «нулевой гипотезы» 95%.

Поскольку χ2 в нашем примере равен 11,7, что больше табличного значения при числе степеней свободы n = (2-1)х(2-1)=1, то нулевая гипотеза оказалась несостоятельна, следовательно, введение противогриппозной вакцины оказывает влияние на уровень заболеваемости гриппом.

ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

Задание №1. Вычислить критерий соответствия χ2 и определить, существенна или несущественна разность между числами, полученными в процессе статистического исследования, и «ожидаемыми величинами».

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]