5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных
.pdfСтатистический анализ медицинских данных ...
100
~
.Ji А
~
u
о
:i:
..а
i:;
ф
~
:s:
ID
~
u
ID
>-
J
50
О+-~~~~~~~~~~~--- |
т~~~~~~~~~~~---- |
i |
о |
50 |
100 |
1-специфичность, %
Рис. 15.11. Характеристические кривые для высокоинформатив
ного (А) и низкоинформативного (Б) меrодов диагностики.
Характеристиками теста, которыми оперирует врач после по лучения результата теста у данного больного, являются следую
щие:
-ПIJПР=а/(а+Ь) - вероятность наличия заболевания при
положительном результате теста;
-ПIJOP=c/(c+d) - вероятность отсутствия заболевания при
отричательном результате теста.
Значения ПIJПР и ПIJOP (при одних и тех же значениях ДЧ и ДС) зависят от распространенности заболевания в исследуе
мой популяqии Р = (а+с) / (a+b+c+d) по следующим форму
лам:
ПIJПР= (ДЧхР) / (ДЧхР+ ( 1-ДС) ( 1- Р))
ПIJOP= (ДСх(l-Р)) / ( (1-ДЧ)хР+ДСх(l-Р))
250
Глава 15. Некоторые общие проблемы".
При разработке скрининговых диагностических тестов обыч
но учитывают низкую распространенность заболевания в популя gии, поэтому скрининговые тесты должны иметь высокую ДС.
Собственно диагностические клинические исследования про
ходят в условиях высокой распространенности заболевания в об следуемой группе, поэтому для таких тестов особенно важна вы сокая ДЧ.
Чем больше ДЧ, тем больше ПlJOP ( т.е. отриgательные ре зультаты отвергают наличие заболевания).
Чем больше ДС, тем больше ПlJПР ( т.е. положительные ре зультаты подтверждают наличие заболевания).
Чем ниже Р (даже при высокой ДС), тем больше ложнопо
ложительных результатов.
Чем выше Р (даже при высокой ДЧ), тем больше ложноот
риgательных результатов.
Чем ниже Р (стремится к нулю), тем ниже ПlJПР (стремит ся к нулю).
Чем выше Р (стремится к lOO°lo), тем ниже ПlJOP (стре
мится к нулю).
Для оgенки ПlJПР более существенна Р (колеблющаяся от долей проgента до десятков проgентов, т.е. в 100 раз и более), чем ДЧ и ДС (колеблющиеся обычно в интервале 60-99%).
Пример: положительные результаты ревматической пробь1 при скрининговом обследовании в популяgии с распространенностью
ревматизма lO°lo подтверждаются в 15°1о случаев, т.е. ПlJПР=15°1о.
В группе больных с наличием симптоматики ревматизма с Р=26°1о тест подтверждается в 40°1о случаев, т.е. ПlJПР=40°1о.
Таким образом, исходя из изложенного ясно, что для анализа
точности диагностического теста не требуется применение ста тистических методов. Однако мы считали необходимым изложить данный материал для обеспечения общности при освещении про
блем анализа результатов исследований. Более сложной является
задача, когда результат теста включает помимо положительного и
отриgательного ответа таюке третий (например, неопределен ный). В этих случаях мы рекомендуем обращаться к статистику.
15.5.2. Анализ согласованности независимых
диагностических заключений
Часто возникает необходимость оgенить, насколько совпада
ют заключения, которые дают разные врачи или которые получе-
251
Статистический анализ медицинских данных ...
ны с помощью разных диагностических методов. Для этого могут применяться коэффиgиент каппа, внутриклассовый коэффиgи ент корреляgии и другие статистические оgенки. Выбор метода
оgенки согласия должен проводиться с учетом типа признака,
являющегося результатом диагностического метода - бинарно го, номинального, порядкового, количественного. Наиболее про стым является случай бинарных признаков, решение для которо
го мы приводим ниже. В других случаях следует использовать
более сложные методы, для чего необходимо обращаться к стати
стику.
Замечание. Для оценки согласия количественных резуль татов тестов часто применяются методы корреляционно
го анализа (Пирсона, Спирмена и др.), что не вполне кор
ректно, так как результаты оценки согласия могут оказаться
завышенными в связи с возникновением аддитивных и муль
типликати6ных ошибок [37] .
Задача: оgенить согласованность результатов, полученных с
помощью двух независимых методов диагностики.
Пример: оgенка совпадения диагностических заключений "бо
лезнь есть - болезни нет" у двух врачей, работающих независи
мо друг от друга.
Решение: к сожалению, в ППП STAТISТICA нет алгоритмов для решения такой задачи. Предлагаем в таком случае пользовать
ся следующим достаточно простым способом. Вероятность случай ного совпадения (согласия) можно рассчитать по формуле:
Ре= Р1хР2+(1- Р1) ( 1- Р2), где Р1 - |
вероятность положитель |
ных заключений у первого врача, Р2 - |
то же у второго врача. |
При наличии чистой случайности в вынесении решений искомая
вероятность равна 50%. При неслучайном вынесении решений
искомая вероятность должна быть больше (на практике бывает больше лишь на 10-20%).
Мерой превышения согласия над случайным согласием мо жет служить коэффиgиент каппа:
К= ( Р0-Р) / (1- Р), где Р0 - вероятность согласия. Стандартная ошибка для К может быть рассчитана по фор
муле:
т |
- |
РоО-Ро) |
|
к - |
n(l - Ре)2 ' |
а rраниgы ДИ соответственно равны к±tхШк.
252
Глава 15. Некоторые общие проблемы...
Значение t принимается обычно приближенно равным 1,96
для 95% ДИ. Точное значение t для конкретного случая можно узнать, воспользовавшись опgией "Вероятностного калькулятора".
STАТISТICA:
~ Модуль "Основные статистики и таблиgы"
( "Basic statistics/TaЬles")
~ Подмодуль "Вероятностный калькулятор"
( "Probability calculator")
В диалоговом окне (см. рис. 7.9) необходимо выполнить
следующее:
-вы6рать вид распределения "tCтьюдента"("Student t test") ;
-выбрать опgии "Обратная ф.р. " , "Двусторонняя" ( "Тwo-s1'd-
ed") и "1-ф.р.";
-задать число степеней свободы "Ст. св." ("df'), df= п-1;
задать значение р (например, 0,05 для вычисления граниg
95°!о ДИ);
нюкать кнопку "Вычислить" ("compute").
Искомое значение t появится в окне "t".
Интерпретация результатов. Полученные результаты мож но интерпретировать следующим образом.
-Если К>О, то заключения врачей (или методов диагностики)
совпадают чаще, чем случайно.
Если К=О, то совпадение заключений случайно.
-Если К<О, то заключения совпадают реже, чем случайно.
253
Статистический анализ медицинских данных ."
Глава 16. Объединение результатов
нескольких исследований
(мета-анализ)
В данной главе мы не останавливаемся на технике выполне ния мета-анализа, так как она требует определенной подготовки
вобласти прикладной статистики. Однако нам хотелось бы дать читателю общие сведения о данном типе исследований, который
взначительной степени основан на использовании статистиче
ских прочедур.
В соответствии с кончепчией доказательной медичины науч
но обоснованными признаются результаты лишь тех клиниче
ских исследований, которые проведены на основе принчипов кли нической эпидемиологии, позволяющих свести к минимуму как
систематические ошибки (путем проведения исследования, струк
тура которого адекватна поставленным задачам), так и случай ные ошибки (с помощью корректного статистического анализа полученных в исследовании данных). Наиболее обоснованные результаты обычно могут быть получены при проведении рандо мизированных контролируемых испытаний лечебных и профи
лактических вмешательств, так как в таких случаях организачия
(т.е. структура) и проведение исследования наиболее близки к
эксперименту в общенаучном понимании этого термина. Достаточно часто результаты исследований, в которых очени
вается эффективность одного и того же лечебного или профила~<
тического вмешательства или диагностического метода при од
ном и том же заболевании, различаются. В связи с этим возника ет необходимость относительной оченки результатов разных ис следований и интеграчии их результатов с челью получения обоб щающего вывода. Эту задачу начало решать возникшее в 1993 г. Кокрановское сотрудничество, названное в честь английского эпи
демиолога А. Кокрана, который впервые призвал своих коллег оченивать эффективность лечебных вмешательств путем анализа результатов всех когда-либо проведенных клинических испыта-
254
Глава 16. Объединение результатов".
ний. Кокрановское сотрудничество объединяет исследователей из
десятков стран (его Российское отделение имеет сайт в Интер
нете: www.cochraпe.ru). IJель Кокрановского сотрудничества -
искать и обобщать путем подготовки систематических обзоров
результаты всех когда-либо проводившихся клинических испыта ний лечебных и профилактических вмешательств. Кокрановское
сотрудничество ведет регистр рандомизированных клинических
испытаний в форме базы данных.
Систематический обзор представляет собой разновидность
научного исследования, в котором объектом изучения являютс-:1.
результаты ряда оригинальных исследований по определенной
проблеме. В отличие от традиgионных обзоров систематические обзоры не тенденgиозны и выполняются в соответствии с четким алгоритмом, обеспечивающим максимально возможную надеж
ность выводов обзора.
Систематические обзоры классифиgируются как качест венные и количественные. В последних используются стати
стические методы обобщения результатов (мета-анализ) раз
личных исследований с gелью получения единого вывода об
эффективности лечебного или профилактического вмешатель ства либо об информативности диагностического метода. При
этом существенно увеличивается выборка, что повышает ста тистическую мощность анализа и точность оgенки эффекта
лечения. Часто систематический обзор, выполненный с исполь
зованием статистических методов, также называют мета-ана
лизом. !Jель мета-анализа - выявление, изучение и объясне ние различий (вследствие наличия статистической неоднород ности, или гетерогенности) в результатах исследований, а так
же более точная оgенка изучаемого эффекта [38).
СУI!Jествуют два основных подхода к выполнению мета-ана
лиза.
Пербый из них заключается в статистическом повторном ана
лизе отдельных исследований путем сбора первичных данных о включенных в оригинальные исследования наблюдениях. Очевид но, что далеко не всегда это выполнимо, но необходимо упомя нуть о том, что в настоящее время за рубежом уже начали созда
ваться банки первичных данных по определенным медиgинским научным проблемам.
Второй (и основной) подход заключается в обобщении опуб ликованных результатов исследований, посвященных одной про-
255
Статистический анализ медицинских данных ...
блеме. Такой мета-анализ выполняется обычно в несколько эта пов [39], среди которых важнейшими являются:
выработка критериев включения оригинальных исследований
в мета-анализ;
оgенка гетерогенности (статистической неоднородности)
результатов оригинальных исследований;
проведение собственно мета-анализа (получение обобщен ной оgенки величины эффекта);
анализ чувствительности выводов.
Необходимо отметить, что этап определения круга включае
мых в мета-анализ исследований (как в аспекте полноты выявле ния выполненных работ, так и в отношении формальных крите
риев оgенки их методологического качества) часто становится
источником систематических ошибок мета-анализа. Качество мета
анализа существенно зависит от качества включенных в него ис
ходных исследований и статей.
К основным проблемам при включении исследований в мета
анализ относятся такие, как различия исследований по критери
ям включения и исключения, структуре исследования, контролю
качества.
Существует таюке смещение, связанное с преимущественным
опубликованием положительных результатов исследования (ис
следования, в которых получены статистически значимые резуль
таты, чаще публикуются, чем те, в которых такие результаты не получены). Поскольку мета-анализ основан главным образом на опубликованных данных, следует обращать особое внимание на
недостаточную репрезентативность отриgательных результатов в
литературе. Включение в мета-анализ неопубликованных резуль татов таюке представляет значительную проблему, так как их
качество неизвестно в связи с тем, что они не проходили реgен
зирование.
Собственно мета-анализ может осуществляться с использова
нием ППП ReviewManager (RevMan, Cochrane Collaboration) 1,
содержащим основные необходимые программные средства для оформления обзора и статистические проgедуры для выполнения собственно мета-анализа. Выбор метода определяется типом ана лизируемых данных (бинарные или непрерывные) и типом мо-
1 Пакет прикладных программ RevMan доступен бесплатно по адресу
Ьttp://www.coclлane.cie/cocЬrane/revшan.htm
256
Глава 16. Объединение результатов...
дели (фикс11рованных эффектов, случайных эффектов). Остано
вимся на этом подробнее.
Бинарные данные обычно анализируются путем вычисле ния отношения шансов (ОШ), относительного риска (ОР) или
разности рисков в сопоставляемых выборках. Все перечисленные показатели характеризуют эффект вмешательств. Представление
бинарных данных в виде ОШ удобно использовать при статисти
ческом анализе, но этот показатель достаточно трудно интерпре
тировать клинически.
Непрерыбнь~ми даннь~ми обычно являются диапазоны зна
чений изучаемых признаков или нестандартизованная разниgа
взвешенных средних в группах сравнения, если исходы оgени
вались во всех исследованиях одинаковым образом. Если же ис
ходы оgенивались по-разному (например, по разным шкалам),
то используется стандартизованная разниgа средних (так назы ваемая величина эффекта) в сравниваемых группах.
Одним из первых этапов мета-анализа является оgенка гете
рогенности (статистической неоднородности) результатов
эффекта вмешательства в разных исследованиях. Для оgенки ге
терогенности часто используют критерий Х2 с нулевой гипотезой
о равном эффекте во всех исследованиях и с уровнем значимости
0,1 для повышения статистической мощности (чувствительности)
теста.
Источниками гетерогенности результатов разных исследова
ний принято считать дисперсию внутри исследований ( обуслов
ленную случайными отклонениями результатов разных исследо
ваний от единого истинного фиксированного значения эффекта),
а таюке дисперсию между исследованиями (обусловленную раз личиями между изучаемыми выборками по характеристикам боль
ных, заболеваний, вмешательств, приводящими к несколько раз
ным значениям эффекта - случайными эффектами).
Если предполагается, что дисперсия между исследованиями
близка к нулю, то каждому из исследований приписывается вес, величина которого обратно пропорgиональна дисперсии резуль
тата данного исследования. Дисперсия внутри исследований в свою очередь определяется объемом выборки и рядом других характе
ристик исследования.
При нулевой дисперсии между исследованиями можно ис
пользовать модель фиксированных (постоянных) эффектов. В этом
случае предполагается, что изучаемое вмешательство во всех ис-
257
Статистический анализ медицинских данных ".
следованиях имеет одну и ту же эффективность, а выявляемые различия между исследованиями обусловлены только дисперсией
внутри исследований. В этой модели пользуются методами Man-
tel-Haenszel и Peto [40, 41].
Модель случайных эффектов предполагает, что эффективность
изучаемого вмешательства в разных исследованиях может быть
разной. Данная модель учитывает дисперсию не только внутри одного исследования, но и между разными исследованиями. В этом случае суммируются дисперсии внутри исследований и дис персия между исследованиями. В модели случайных эффектов
чаще всего применяют метод DerSimonian и Laiгd [42] , позво
ляющий оgенить дисперсию между исследованиями.
IJелью мета-анализа непрерывных данных обычно является
представление точечных и интервальных (95'/"0 ДИ) оgенок обоб
щенного эффекта вмешательства.
Существует таюке ряд других подходов к выполнению мета анализа: байесовский мета-анализ, кумулятивный мета-анализ,
многофакторный мета-анализ, мета-анализ выживаемости (пе речисленные методы пока не представлены в ППП RevMan вер
сии 3.0).
Байесобский мета-анализ позволяет рассчитать априорные вероятности эффективности вмешательства с учетом косвенных данных. Такой подход особенно эффективен при малом числе
анализируемых исследований. Он обеспечивает более точную оgен
ку эффективности вмешательства в модели случайных эффектов за счет объяснения дисперсии между разными исследованиями.
Кумумтибный мета-анализ - частный случай байесов
скоrо мета-анализа - пошаговая проgедура включения результа
тов исследований в мета-анализ по одному в соответствии с ка
ким-либо' принgипом (в хронологической последовательности, по
мере убывания методологического качества исследования и т.д.). Он позволяет рассчитывать претестовые (априорные) и послете стовые (апостериорные) вероятности в итераgионном режиме
по мере включения исследований в анализ.
Регрессионный мета-анализ (логистическая регрессия, рег рессия взвешенных наименьших квадратов, модель Кокса и др.)
используется при СУIIJественной гетерогенности результатов ис следоваJµ'!Й. Он позволяет учесть влияние нескольких характери
стик исследования (например, размера выборки, дозы препара та, способа его введения, характеристик больных и др.) на ре-
258
Глава 16. Объединение результатов...
зультаты испытаний вмешательства. Результаты регрессионного
мета-анализа обычно представляют в виде коэффиgиента накло
на с указанием ДИ.
Следует заметить, что мета-анализ может выполняться для
обобщения результатов не только контролируемых испытаний
медиgинских вмешательств, но и когортных исследований (на
пример, исследований факторов риска). Однако при этом следу
ет учитывать высокую вероятность возникновения систематиче
ских ошибок.
Особый вид мета-анализа - обобщение оgенок информа
тивности диагностических методов, полученных в разных иссле
дованиях. IJель такоi:о мета-анализа - построение характери
стической кривой взаимной зависимости чувствительности и спе gифичности тестов (RОС-кривой) с использованием взвешенной
линейной регрессии.
После получения обобщенной оgенки величины эффекта воз никает необходимость определить ее устойчивость. Для этого выполняется так называемый анализ чувствительности. Одним из способов его проведения является сопоставление результатов,
получаемых в двух моделях -фиксированных и случайных эф
фектов. Во второй модели результаты обычно бывают статистиче ски менее значимыми. Другой способ анализа чувствительности
-исключение того или иного исследования из анализа и пере
счет результатов с последующей оgенкой гетерогенности резуль
татов по критерию х2•
Существуют таюке способы оценки полноты выявления включенных в мета-анализ исследований. Обычно неполно та выявления связана с возникновением систематической ошиб ки, связанной с преимущественным опубликованием положитель ных результатов исследований (результатов, описывающих ста тистически значимые различия групп). Для качественной оgенки наличия такой систематической ошибки мета-анализа обычно при
бегают к построению воронкообразной диаграммы рассеяния ре
зультатов отдельных исследований в координатах (величина эф
фекта, размер выборки). При полном выявлении исследований эта диаграмма должна быть симметричной. Вместе с тем сущест
вуют и формальные методы оgенки существующей асимметрии. Результаты мета-анализа обычно представляются графиче<1:ки (точечные и интервальные оgенки величин эффектов каждого из
включенных в мета-анализ исследований; пример на рис. 16.1) и
259