Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

VEROJATNOSTNAJA_DIAGNOSTIKA_PO_BAIESU

.pdf
Скачиваний:
35
Добавлен:
18.05.2015
Размер:
143.16 Кб
Скачать

ВЕРОЯТНОСТНАЯ ДИАГНОСТИКА ПО БАЙЕСУ

Цели работы

1.Познакомиться с возможностями диагностических систем.

2.Познакомиться с принципом метода вероятностной диагностики.

3.Опробовать на практике метод вероятностной диагностики по Байесу в компьютерном исполнении.

I.Контрольные вопросы

1.В каких случаях целесообразно использовать диагностические системы?

2.Назовите этапы диагностического алгоритма.

3.Назовите основные виды врачебной логики.

4.В чем заключается смысл информационно-вероятностной логики?

5.Как рассчитывается вероятность диагноза по Байесу?

6.Что такое априорная вероятность диагноза?

7.В чем на, Ваш взгляд, заключаются преимущества и недостатки машинных методов диагностики, по сравнению с традиционными?

8.Как Вы считаете, действительно симптомы, перечисленные в диагностической таблице, встречаются с такой вероятностью?

II. Теоретическая часть

В медицине врачи принимают важное решение, которое определяет успех всей работы: ставят диагноз. Точность диагностики зависит от квалификации специалиста (эксперта) – его умения правильно проанализировать имеющуюся информацию. Но бывают ситуации, когда нет высококвалифицированного специалиста по какой-либо специальности. Поэтому, по мере развития вычислительной техники, возникла идея заложить знания специалистов в компьютер и использовать его в качестве электронного эксперта.

По способу решения задачи диагностики различают вероятностные системы и экспертные системы. В вероятностных системах диагностика осуществляется реализацией одного из методов распознавания образов или статистических методов принятия решений. В экспертных системах — реализуется логика принятия диагностического решения опытным врачом.

Применение диагностических систем (вероятностных и экспертных) наиболее важно в следующих случаях:

неотложные и угрожающие состояния;

дефицит времени;

ограниченные возможности обследования;

скудная клиническая симптоматика;

быстрые темпы развития заболевания.

Необходимо отметить, что работа с диагностическими системами может вестись удаленно.

1.Диагностический алгоритм

Сточки зрения кибернетики, диагностика - это поэтапный процесс переработки информации в системе “врач - больной“. Первый этап диагностического процесса - сбор информации о состоянии больного; второй этап - отбор из нее наиболее существенных данных и систематизация их в определенный симптомокомплекc; третий этап - сопоставление его с данными об известных заболеваниях. Логическая последовательность правил, в которой информация о состоянии больного сопоставляется с комплексом признаков типичных заболеваний, называется диагностическим алгоритмом. На основании результатов сравнения и принимается решение о диагнозе. Это решение является простым и для врача, и для компьютера, только тогда, когда весь набор симптомов у больного совпадает с симптомокомплексом определенного заболевания. На практике это встречается не столь часто и приходится выбирать несколько возможных диагнозов с указанием их вероятности.

2.Основные виды врачебной логики

Детерминистская логика - это наиболее простой диагностический приём, основанный на прямых связях между наличием у больного определенных симптомов и диагнозом заболевания. Есть симптом - 1, нет - 0. И затем количество “единичек” у больного сравнивается с количеством их у эталона диагноза.

Метод фазового интервала - это приём, при котором в многомерном пространстве симптомов заранее строятся области различных заболеваний. Сущность диагностического процесса состоит в том, чтобы определить, к какой из выделенных областей ближе всего находится точка, представляющая симптомокомплекс данного больного.

Информационно-вероятностная логика - это диагностический приём, в котором при вычислении вероятностей нескольких диагнозов при данном симптомокомплексе учитывается разная вероятность каждого симптома при разных заболеваниях (а не просто “да - нет”, как в детерминистском).

Метод экспертных систем - это такой диагностический алгоритм, при котором знания опытных специалистов, экспертов представлены в виде программы с ветвлениями типа “если..., то...”, а на концах этих ветвей расположены диагнозы. Компьютер при опросе больного проходит по той или иной ветви и в завершение выставляет диагноз. Такие программы при постановке диагноза в трудных случаях действуют на уровне специалиста высшей медицинской категории.

Целью данной работы является более подробное ознакомление с информационновероятностным подходом при машинной постановке диагноза.

3. Метод информационно-вероятностной логики

Данный метод предложен М.Л. Быховским. В основе метода лежит диагностическая таблица, составленная для определённого класса заболеваний. Составление таких таблиц - сложная задача. Для её решения изучается и обрабатывается большое количество историй болезней с проверенными диагнозами, что стало возможным только благодаря применению для этих целей компьютера. А именно, на компьютере вычисляются условные вероятности наличия симптомов Si при заболевании Dj, которые обозначаются P(Si/Dj) (читается: “Вероятность Si при Dj”).

Условная вероятность P(Si/Dj) означает, что если у больного установлено заболевание с диагнозом Dj, то симптомы Si, относящиеся к данному заболеванию, имеют вероятность P (Si/Dj). Например, берется 1000 историй болезней с диагнозом “туберкулёз лёгких”. Из историй болезней выписываются все симптомы, встретившиеся при этом заболевании. Так повышение температуры встретилось у 980 больных, значит вероятность этого симптома равна 980/1000 = 0,98. Повышение давления встретилось в 30 случаях при данном диагнозе, вероятность этого симптома равна 30/1000 = 0,03 и т.д. Эти вероятности сводятся в таблицу, которая является основой метода. В диагностическую таблицу, входит: набор симптомов Si, относящихся к определенному классу заболеваний (по вертикали), болезни данного класса (по горизонтали), и набор P(Si/Dj) для различных заболеваний. Диагноз ставится не по одному, а по нескольким симптомам, обнаруженным у больного. Например, S2, S7, S9, S14, S19 - этот набор симптомов называется симптомокомплексом. Будем обозначать его Sci.

4. Вероятность диагноза

Первое, что делается при рассматриваемом диагностическом методе - это выборка вероятностей всех симптомов для предполагаемых заболеваний. Так как одни и те же симптомы могут с разной вероятностью проявляться при разных диагнозах, то должно появиться четыре группы чисел, если заболеваний четыре:

P(S2/D1), …

P(S2/D4)

P(S7/D1), …

P(S7/D4)

….… … ….

P(S19/D1), … …. P(S19/D4)

Если симптомов много и много возможных диагнозов, что и бывает на практике, то один этот этап выборки осуществить без привлечения компьютера трудно.

Второе: условную вероятность симптомокомплекса вычисляют по формуле:

P(Sci/Dj)=P(S1/Dj)*P(S2/Dj)*…..*P(Sn/Dj)

То есть перемножают вероятности симптомов последовательно во всех группах чисел.

Третье: задача диагностики заключается в том, чтобы на основании симптомокомплекса, установленного у больного, и данных диагностической таблицы определить вероятности P(Dj/Sci) каждой из имеющихся в таблице болезней Dj, т.е. по сути дела нужно перейти от P(Sci/Dj) к P(Dj/Sci). Этот переход осуществляется по известной в теории вероятностей формуле Байеса:

P(Dj/Sci) = P(Sci/Dj)*P(Dj)/P(Sc).

В эту формулу входит P(Dj), которую называют априорной вероятностью некоторого заболевания Dj. Вероятность P(Dj) характеризует распределение болезней в данной группе населения. Такой группой может быть контингент данной больницы, данного района, данного города. Априорной (доопытной) она называется потому, что уже известна до получения симптомокомплекса, т.е. к ней новый больной никакого отношения не имеет. Смысл введения в диагностику величины P(Dj) состоит в том, что она непостоянна и зависит от географических, сезонных, эпидемиологических и других факторов, которые должны быть учтены при постановке диагноза. Например, в какой-либо больнице наугад было выбрано 100 больных, 70 из них оказались больны гриппом. Значит, вероятность заболевания гриппом у всех пациентов в данной больнице будет равна 70/100 = 0,7, когда эпидемия гриппа будет ликвидирована, естественно и P(Dj) для гриппа в этой больнице будет другой.

Знаменатель формулы Байеса представляет полную вероятность наличия комплекса при всех болезнях:

P(Sc) = ∑ P(Sci/Dj)*P(Dj)

j

Этот сомножитель вводится в формулу Байеса для нормировки, т.е. чтобы получающиеся вероятности были выражены в процентах. Суммирование здесь производится по индексу j (номер диагноза). В нашем примере в этой сумме окажется четыре слагаемых.

Диагноз, имеющий наибольшую вероятность, и будет рассматриваться как искомый диагноз. Оценить достоверность результата и поставить окончательный диагноз может только врач. Например, если полученный диагноз имеет вероятность меньше 60%, то результат не является достоверным и необходимо повторить процедуру диагностики, увеличив число симптомов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]