- •Вниманию авторов! Требования к оформлению пособия.
- •Тема 1. Введение в биостатистику. Типы данных.
- •Номинальные переменные
- •Порядковые переменные
- •Количественные данные. Интервальные переменные
- •Задача-эталон
- •Решение
- •План исследования
- •Тема 2. Варияционный ряд. Числовая характеристика дискретного статистического ряда. Средние величины. Полигон.
- •Задача-эталон
- •Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал.
- •Задача-эталон
- •Тема 4. Интервальный статистический дискретный ряд распределения. Числовые характеристики интервального статистического ряда. Гистограмма.
- •График 1. Гистограмма
- •Задача-эталон
- •Тема 5. Нулевая гипотеза. Альтернативная гипотеза. Ошибки первого и второго рода.
- •Основные свойства гипотезы
- •Статистические гипотезы.
- •Обобщённая методика проверки статистических гипотез
- •Принятие неправильного решения
- •Задача-эталон
- •Решение
- •Тема 6. Нормальное распределение, характеристика, графическая проверка.
- •Значение
- •Нормальное распределение в природе и приложениях
- •Для оценки «крутизны» (островершинности) распределения пользуются характеристикой – эксцессом.
- •Проверка на нормальность(r-ч.0,06%)
- •Задача-эталон Критерии Колмогорова – Смирнова
- •Тема 8. Критерий Стюдента
- •Задача-эталон
- •Тема 9. Дисперсионный анализ
- •Задача-эталон
- •Тема 10. Отношение шансов. Относительный риск. Таблица сопряженности.
- •1. История разработки показателя отношения шансов
- •2. Для чего используется показатель отношения шансов?
- •3. Условия и ограничения применения отношения шансов
- •4. Как рассчитать отношение шансов?
- •5. Как интерпретировать значение отношения шансов?
- •Задача-эталон
- •1. История разработки показателя относительного риска
- •2. Для чего используется относительный риск?
- •3. Условия и ограничения применения относительного риска
- •4. Как рассчитать относительный риск?
- •5. Как интерпретировать значение относительного риска?
- •Задача-эталон
- •Тема 11. Критерий χ2 Пирсона.
- •1. История разработки критерия χ2
- •2. Для чего используется критерий χ2 Пирсона?
- •3. Условия и ограничения применения критерия хи-квадрат Пирсона
- •4. Как рассчитать критерий хи-квадрат Пирсона?
- •5. Как интерпретировать значение критерия хи-квадрат Пирсона?
- •6. Пример расчета критерия хи-квадрат Пирсона
- •Задача-эталон
- •Анализ таблицы сопряженности
- •Тема12. Корреляционный анализ
- •Задача-эталон
- •Задача-эталон
- •Тема 13. Анализ выживаемости.
- •Задача-эталон
3. Условия и ограничения применения критерия хи-квадрат Пирсона
Сопоставляемые показатели должны быть измерены в номинальной шкале (например, пол пациента - мужской или женский) или в порядковой (например, степень артериальной гипертензии, принимающая значения от 0 до 3).
Данный метод позволяет проводить анализ не только четырехпольных таблиц, когда и фактор, и исход являются бинарными переменными, то есть имеют только два возможных значения (например, мужской или женский пол, наличие или отсутствие определенного заболевания в анамнезе...). Критерий хи-квадрат Пирсона может применяться и в случае анализа многопольных таблиц, когда фактор и (или) исход принимают три и более значений.
Сопоставляемые группы должны быть независимыми, то есть критерий хи-квадрат не должен применяться при сравнении наблюдений "до-"после". В этих случаях проводится тест Мак-Немара (при сравнении двух связанных совокупностей) или рассчитывается Q-критерий Кохрена (в случае сравнения трех и более групп).
При анализе четырехпольных таблиц ожидаемые значения в каждой из ячеек должны быть не менее 10. В том случае, если хотя бы в одной ячейке ожидаемое явление принимает значение от 5 до 9, критерий хи-квадрат должен рассчитываться с поправкой Йейтса. Если хотя бы в одной ячейке ожидаемое явление меньше 5, то для анализа должен использоваться точный критерий Фишера.
В случае анализа многопольных таблиц ожидаемое число наблюдений не должно принимать значения менее 5 более чем в 20% ячеек.
4. Как рассчитать критерий хи-квадрат Пирсона?
Для расчета критерия хи-квадрат необходимо:
Рассчитываем ожидаемое количество наблюдений для каждой из ячеек таблицы сопряженности (при условии справедливости нулевой гипотезы об отсутствии взаимосвязи) путем перемножения сумм рядов и столбцов с последующим делением полученного произведения на общее число наблюдений. Общий вид таблицы ожидаемых значений представлен ниже:
|
Исход есть (1) |
Исхода нет (0) |
Всего |
Фактор риска есть (1) |
(A+B)*(A+C) / (A+B+C+D) |
(A+B)*(B+D)/ (A+B+C+D) |
A + B |
Фактор риска отсутствует (0) |
(C+D)*(A+C)/ (A+B+C+D) |
(C+D)*(B+D)/ (A+B+C+D) |
C + D |
Всего |
A + C |
B + D |
A+B+C+D |
Таблица 5. Таблица ожидаемых значений
Находим значение критерия χ2 по следующей формуле:
где i – номер строки (от 1 до r), j – номер столбца (от 1 до с), Oij – фактическое количество наблюдений в ячейке ij, Eij – ожидаемое число наблюдений в ячейке ij.
В том случае, если число ожидаемого явления меньше 10 хотя бы в одной ячейке, при анализе четырехпольных таблиц должен рассчитываться критерий хи-квадрат с поправкой Йейтса. Данная поправка позволяет уменьшить вероятность ошибки первого типа, т.е обнаружения различий там, где их нет. Поправка Йейтса заключается в вычитании 0,5 из абсолютного значения разности между фактическим и ожидаемым количеством наблюдений в каждой ячейке, что ведет к уменьшению величины критерия хи-квадрат.
Формула для расчета критерия χ2 с поправкой Йейтса следующая:
Определяем число степеней свободы по формуле: f = (r – 1) × (c – 1). Ссответственно, для четырехпольной таблицы, в которой 2 ряда (r = 2) и 2 столбца (c = 2), число степеней свободы составляет f2x2 = (2 - 1)*(2 - 1) = 1.
Сравниваем значение критерия χ2 с критическим значением при числе степеней свободы f (по таблице).
Данный алгоритм применим как для четырехпольных, так и для многопольных таблиц.
