
- •А.В. Тишков, н.Н. Хромов-Борисов, а.В. Комашня, ф.Ю. Марченкова, е.М. Семенова, н.И. Эюбова, е.А. Делакова, а.В. Быхова
- •Пояснительная записка
- •Введение
- •Статистический анализ – единственный путь оценки и сравнения клинико-лабораторных диагностических тестов
- •Основные типы клинико-лабораторных тестов1
- •Клинико-лабораторные диагностические исследования2
- •«Золотой стандарт» или Эталон сравнения
- •Необходимые сведения из теории вероятностей и математической статистики3
- •Вероятности и/или одды (шансы за и против) - два способа выражения для степени правдоподобия случайного события
- •«Одды» (шансы за и против)
- •Независимые события
- •Отношение оддов
- •Условные вероятности
- •«Заблуждение обвинителя»
- •Формула Бейза: вероятность причин, гипотез, или обратные или предсказательные вероятности
- •Формула Бейза в терминах оддов и правдоподобий
- •Популяция и выборка Определение понятия «популяция»
- •Важнейшее требование к популяции и к выборке - однородность4
- •Всё познается в сравнении
- •Требования к проведению проверки качества клинико-лабораторного диагностического теста
- •Эталонный клинико-лабораторный диагностический тест
- •Диагностическая таблица перекрестной классификации 2×2
- •Типы показателей качества диагностических тестов
- •Показатели предсказательной способности пклдт, т.Е. Способности его положительных или отрицательных результатов предсказывать наличие или отсутствие диагностируемой болезни
- •Отношения правдоподобий
- •Представление отношений правдоподобий в терминах оддов (шансов за и против)
- •Показатели согласованности
- •Отношение оддов
- •Коэффициент каппа Коуэна
- •Наблюдаемые численности исходов
- •Статистическое оценивание
- •Два основных типа статистических оценок
- •Основная логика статистического оценивания: точечные оценки
- •Основная логика статистического оценивания: интервальные оценки
- •Доверительные интервалы
- •Точность и надежность статистических оценок
- •Надежность доверительных интервалов (ди)
- •Точечные статистические оценки вероятностей наблюдать положительные или отрицательные результаты пклдт у субъектов с болезнью или без нее
- •Идеальный и бесполезный тесты в терминах Se и Sp
- •Возможные словесные интерпретации для градаций Se и Sp
- •Статистическая интерпретация ди для Se и Sp
- •Статистическая значимость Se и Sp
- •Точечные статистические оценки предсказательных вероятностей наличия или отсутствия болезни у субъектов с положительными или отрицательными результатами пклдт
- •Идеальный и бесполезный тесты в терминах ppv и npv
- •Точечные статистические оценки для отношений правдоподобий
- •Идеальный и бесполезный тесты в терминах lr
- •Статистическая интерпретация ди для lr
- •Статистическая значимость lr
- •Показатели согласованности Отношение оддов
- •Статистическая интерпретация ди для or
- •Статистическая значимость or
- •Словесная интерпретация градаций для or5
- •Коэффициенты каппа Коуэна
- •Статистическая интерпретация ди для κC
- •Статистическая значимость κC
- •Словесная интерпретация градаций коэффициента каппа Коуэна
- •Исследования типа «случаи – контроли»
- •Наблюдаемые численности исходов при формировании выборок по схеме «случаи-контроли»
- •Оценки предсказательных ценностей положительных и отрицательных результатов теста в схеме «случаи» и «контроли» Согласно теореме Бейза:
- •Точечные статистические иоценки предсказательных вероятностей наличия или отсутствия болезни у субъектов с положительными или отрицательными результатами пклдт в схеме «случаи» и «контроли»
- •Приложение
- •Дополнительные показатели точности и информативности клинико-лабораторных диагностических тестов Дополнительные показатели точности
- •Дополнительные показатели информативности
- •Литература
- •Построение доверительных интервалов для основных показателей согласованности, точности и информативности клинико-лабораторного диагностического теста
- •Доверительные интервалы для показателей точности и информативности при формировании общепопуляционной выборки
- •Доверительные интервалы для ppv и npv при формировании выборок по схеме «случаи-контроли»
- •Доверительные границы для разности долей
- •Частотнический подход
- •Бейзовский подход
- •Доверительный интервал для коэффициента каппа Коуэна
- •Доверительный интервал для отношения оддов
Всё познается в сравнении
Примечание: в данном тексте жирным шрифтом выделяются оцениваемые (неизвестные) величины, а простым шрифтом – их статистические оценки.
Прежде чем внедрять в практику некий клинико-лабораторный диагностический тест, надо провести проверку его надежности, точности, валидности, эффективности и информативности.
Требования к проведению проверки качества клинико-лабораторного диагностического теста
Процедура проверки предлагаемого метода диагностики должна быть стандартизирована и внятно изложена в соответствующей нормативной документации (инструкциях, протоколах исследования, методических указаниях, методических рекомендациях, или иных подобных документах). При проверке метода и интерпретации получаемых результатов следует неукоснительно руководствоваться положениями таких документов.
Одним из основополагающих таких документов является: ГОСТ Р 53022.3-2008 Технологии лабораторные клинические. Требования к качеству клинических лабораторных исследований. Часть 3. Правила оценки клинической информативности лабораторных тестов.
Эталонный клинико-лабораторный диагностический тест
Для испытания надежности, точности, валидности, эффективности и информативности проверяемого клинико-лабораторного диагностического теста (ПКЛДТ) фактически нет иного пути, как сравнить результаты, получаемые с его использованием, с результатами некоего эталонного (практически безошибочного) диагностического теста, который принято называть «эталоном сравнения» (Reference Standard) или «золотым стандартом» (Gold Standard).
«Золотой стандарт» или «эталон сравнения» – это такой диагностический тест, который максимально точно (практически безошибочно) определяет наличие или отсутствие определенной болезни у пациента. Например, при диагнозе рака одними из наиболее убедительных принято считать результаты гистологической диагностики. Окончательный диагноз болезни Альцгеймера устанавливается лишь после смерти пациента.
Эталонная диагностика вовсе не обязательно должна быть результатом применения одного единственного теста. Чаще всего это есть результат всестороннего определения наличия или отсутствия данной болезни у данного субъекта с применением целого арсенала наиболее надежных средств диагностики и интерпретации их результатов специалистами-профессионалами.
Диагностическая таблица перекрестной классификации 2×2
В данном методическом пособии обсуждаются наиболее простые варианты клинико-лабораторных исследований. В них получаемые данные являются счетными, а не мерными, и каждый результат клинико-лабораторного теста («ответ») выражается одним словом из пары противопоставлений: «да» или «нет», «имеется» или «отсутствует», «положительный» или «отрицательный»). Их еще называют бинарными или дихотомическими.
Положительные результаты тестов будем называть «позитивами», а отрицательные – «негативами». В таком случае возможны всего четыре комбинации исходов, составленные из пар положительного и/или отрицательного результатов проверяемого теста и эталона сравнения. Их обозначения и названия представлены в Табл. 1. Такую четырехпольную таблицу называют таблицей перекрестной классификации или таблицей сопряжености . Для наших целей более адекватным является первое название. Такая таблица является удобной, наглядной и компактной формой для представления как исходных («сырых») данных, так и результатов их статистического анализа.
Обычно (по умолчанию) в столбцах такой таблицы представляют результаты применения Эталона сравнения («Золотого стандарта»), а в строках таблицы представляют результаты применения изучаемого теста. Иногда, однако, строки и столбцы в таблице меняют местами, и это следует учитывать при использовании вычислительных формул.
Таблица 1. Таблица перекрестной классификации 2×2 для представления результатов испытания проверяемого клинико-лабораторного диагностического теста (ПКЛДТ) в сравнении с результатами эталонного теста. Исходы, их обозначения и названия
Проверяемый клинико-лабораторный диагностический тест (ПКЛДТ) |
Эталон сравнения |
Всего |
||
Результат (исход): |
||||
Болезнь есть, [+] |
Болезни нет, [-] |
|||
Результат (исход): |
Положительный, [+] |
Истинный «позитив» |
Ложный «позитив» |
|
Отрицательный, [-] |
Ложный «негатив» |
Истинный «негатив» |
|
|
Всего |
|
|
|
Интерпретация символов:
D – болезнь (от англ. Disease)
T – тест (от англ. Test)
наличие
болезни (у субъекта).
отсутствие
болезни.
"позитив",
т.е. положительный результат проверяемого
диагностического теста (метода, средства).
"негатив"
- отрицательный результат
проверяемого
теста.
"истинный позитив", или верно положительный результат, т.е. исход, при котором оба диагностических теста – эталонный и проверяемый – одинаково дали у одного и того же субъекта положительные результаты: и и . Другое обозначение - TP (от англ. True Positive).
"ложный позитив", или ошибочно положительный результат, т.е. исход, при котором сравниваемые диагностические тесты дали у одного и того же субъекта противоположные результаты: эталонный тест дал отрицательный результат ( ), а проверяемый тест дал положительный результат ( ). Другое обозначение - FP (от англ. False Positive).
"ложный негатив", или ошибочно отрицательный результат, т.е. исход, при котором сравниваемые диагностические тесты дали у одного и того же субъекта противоположные результаты: эталонный тест дал положительный результат ( ), а проверяемый тест дал отрицательный результат ( ). Другое обозначение - FN (от англ. False Negative).
"истинный негатив", или негатив при отсутствии болезни, т.е. исход, при котором оба диагностических теста – эталонный и проверяемый – одинаково дали у одного и того же субъекта отрицательные результаты: и и . Другое обозначение - TN - (от англ. True Negative).
Предполагается, что эти исходы являются случайными событиями, т.е. они происходят с вероятностями, присущими конкретной паре эталона сравнения и ПДТ. Вероятности исходов представлены в Табл. 2
Поэтому повторим, что клинико-лабораторные тесты диагностируют не наличие или отсутствие болезни, но лишь их вероятности.
Таблица 2. Вероятности исходов при сравнении проверяемого клинико-лабораторного диагностического теста (ПКЛДТ) с эталоном сравнения
Проверяемый клинико-лабораторный диагностический тест (ПКЛДТ) |
Эталон сравнения |
Всего |
|||||
Результат: |
|||||||
Болезнь есть, [+] |
Болезни нет, [-] |
||||||
Результат: |
Положительный, [+] |
|
|
|
|||
Отрицательный, [-] |
|
|
|
||||
Всего |
|
|
1 |
Интерпретация выражений:
"распространенность" болезни, т.е. вероятность выявить наличие болезни у любого случайно выбранного субъекта в изучаемой популяции посредством эталонного средства диагностики, т.е. с помощью эталона сравнения. Другое обозначение – Prev (от Prevalence).
вероятность выявить отсутствие болезни у любого случайно выбранного субъекта в изучаемой популяции посредством эталонного средства диагностики, т.е. с помощью эталона сравнения.
вероятность «позитива», т.е. вероятность получить положительный результат у любого случайно выбранного из данной популяции субъекта при использовании проверяемого диагностического теста (ПДТ).
вероятность «негатива», т.е. вероятность получить отрицательный результат у любого случайно выбранного из данной популяции субъекта при использовании проверяемого диагностического теста (ПДТ).
вероятность истинного позитива, т.е. вероятность получить у любого случайно выбранного субъекта в данной популяции совпадающие результаты: положительный результат при использовании эталонного средства диагностики и положительный результат при использовании проверяемого диагностического теста .
вероятность ложного позитива, т.е. вероятность получить у любого случайно выбранного субъекта в данной популяции несовпадающие результаты: отрицательный результат при использовании эталонного средства диагностики и положительный результат при использовании проверяемого диагностического теста .
вероятность ложного негатива, т.е. вероятность получить у любого случайно выбранного субъекта в данной популяции несовпадающие результаты: положительный результат при использовании эталонного средства диагностики и отрицательный результат при использовании проверяемого диагностического теста .
вероятность истинного негатива, т.е. вероятность получить у любого случайно выбранного субъекта в данной популяции совпадающие результаты: отрицательный результат при использовании эталонного средства диагностики и отрицательный результат при использовании проверяемого диагностического теста .
Проблема заключается в том, что конкретные значения вероятностей этих исходов нам не известны. И все что мы можем сделать – это попытаться оценить их на основе наблюдаемых численностей исходов.
Принципиально важно, что субъекты выбираются из одной и той же практически однородной популяции чисто случайным образом.