
Metod(ksmd5)
.pdfесть если синдром у больного есть, то он страдает заболеванием Bi . Пусть имеющиеся сведения о больном составляют систему при-
знаков Dmx(x1, , xm ) , где m – количество признаков; x j s j – нали-
чие j-го признака; x j s j – отсутствие j-го признака. Тогда детерми-
нистская логика состоит из двух этапов.
1) На код Dmx последовательно накладываются коды синдромов (операция сравнения). Совпадение по строке медицинской памяти дает номер заболевания Bi . Если совпадение произошло, то процесс диагностики заканчивается. Если ни один из кодов синдромов не совпадает с Dmx , то необходим переход ко второму этапу.
2) Исключаются все те заболевания, детерминистские коды которых (0 и 1, содержащиеся в i-м ряду табл. 3.1) не совпадают по соответствующим разрядам с кодом Dmx .
После второго этапа детерминистской логики остается список заболеваний, возможных при данной симптоматике больного. Чтобы определить диагноз, необходим переход к другим логикам (например, к информационно-вероятностной логике).
Порядок выполнения лабораторной работы
1. Использовать ТЭД лабораторной работы 1 в качестве ис-
ходных данных.
2. Произвести дихотомию исходных признаков. Границы нор-
мы (соответствующие условия) по каждому из признаков находятся в файле ksmd_v#.xls, во второй строке столбцов J÷Q. Таким образом,
если условие выполняется, то xij 0 , в противном случае – |
xij 1 . |
|||||||
3. Рассчитать необходимые вероятности и заполнить медицин- |
||||||||
скую память системы (см. табл. 3.1). |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
3.1. Вычислить массив значений N1i , i 1, k , где |
N1i |
– количе- |
||||||
ство пациентов с диагнозом Bi ; k – количество диагнозов. |
|
|
|
|||||
|
|
|
|
|
|
|||
3.2. Вычислить массив значений N 2ij , i 1, k , |
j 1, m , где |
|||||||
40 |
|
|
|
|
|
|
|
|

N 2ij |
– количество пациентов с диагнозом |
Bi , у которых проявился |
|
признак x j (то есть xij 1 ). |
|
|
|
|
3.3. Вычислить массив значений |
N 3 j , |
j 1, m , где N 3 j – коли- |
чество пациентов, у которых проявился признак x j (то есть xij 1 ) 3.4. Вычислить вероятности заболеваний Bi , i 1, k по формуле
|
N1 |
|
|
P(Bi ) |
i |
. |
|
N |
|||
|
|
где N – длина выборки (количество пациентов в ТЭД).
3.5. Вычислить условные вероятности появления признака
пациентов с заболеванием Bi по выражению
x j
у
P(s |
|
/ B ) |
N 2 |
ij |
|
|
|||
j |
|
|
||
|
i |
N1 |
||
|
|
|
||
|
|
|
|
i |
,
i
1, k
,
j
1, m
.
3.6. Вычислить априорные вероятности наличия j-го признака по выражению
|
|
|
N |
|
P(s |
|
) |
j |
|
j |
N |
|||
|
|
|||
|
|
|
,
j
1, m
.
4.Сохранить медицинскую память системы в файле memory_v#.* (расширение выбрать в соответствии с типом файла).
5.Выполнить диагностику для 4 пациентов (в соответствии с индивидуальным заданием).
5.1. Заполнить массив
Dmx(x |
, , x |
m |
) |
1 |
|
|
поочередно для каждого из
пациентов (значения признаков взять из ТЭД с дихотомическими признаками).
|
5.2. Выполнить первый этап детерминистской логики. |
|
||
|
5.2.1. Вычислить |
массив расстояний Хемминга между кодом |
||
Dmx |
и кодами синдромов (строками табл. 3.1) по выражению |
|
||
|
|
|
m |
|
|
d |
(H ) |
(Dmx, Bi ) x j P(s j / Bi ) . |
|
|
|
|
||
|
|
|
j 1 |
|
|
5.2.2. Если d (H ) (Dmx, B ) 0 , то пациенту с кодом Dmx |
ставится |
||
|
|
|
i |
|
диагноз Bi и процесс диагностики заканчивается (то есть для данного
41

пациента п. 5.3 не выполняется). Если для кодов синдромов
d |
(H ) |
(Dmx, B ) |
|
||
|
|
i |
0
, то выполнить
п. 5.3.
5.2.3. В случае постановки диагноза для данного пациента сравнить полученный диагноз с тем, который хранится в ТЭД.
5.3. Выполнить второй этап детерминистской логики.
5.3.1. Для данного пациента сделать копию таблицы, содержащей медицинскую память системы (см. табл. 3.1).
5.3.1. Если в полученной таблице хотя бы для одного элемента i-й
строки (
i
1, k
) выполняется условие
x |
j |
P(s |
j |
/ B ) |
|
|
i |
1
, то удалить эту
строку из таблицы.
5.3.2. Сохранить в файле значения дихотомических признаков и список возможных болезней для каждого из пациентов.
6.Сделать выводы по результатам диагностики.
7.Оформить отчет по лабораторной работе.
Индивидуальные задания
По 2-й цифре номера в журнале выбрать индивидуальное задание (табл. 3.2).
Таблица 3.2 – Индивидуальные задания
2-я цифра но- |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
мера в журнале |
|||||||||||
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
Имя файла |
1 |
2 |
1 |
2 |
1 |
2 |
1 |
2 |
1 |
2 |
|
ksmd_v#.xls |
|||||||||||
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
1-й пациент |
2 |
5 |
3 |
34 |
5 |
52 |
6 |
59 |
24 |
73 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2-й пациент |
57 |
51 |
61 |
53 |
64 |
55 |
72 |
57 |
78 |
58 |
|
|
|
|
|
|
|
|
|
|
|
|
|
3-й пациент |
10 |
8 |
11 |
14 |
12 |
15 |
14 |
36 |
18 |
86 |
|
|
|
|
|
|
|
|
|
|
|
|
|
4-й пациент |
7 |
4 |
21 |
11 |
25 |
18 |
58 |
24 |
70 |
25 |
|
|
|
|
|
|
|
|
|
|
|
|
Примечание: в индивидуальном задании указан № п/п пациента в ТЭД с дихотомическими признаками.
42
Содержание отчета
1.Тема, цель лабораторной работы.
2.Индивидуальное задание.
3.Текст программы.
4.Содержание медицинской памяти системы.
5.Результаты диагностики.
6.Выводы, сделанные на основании полученных результатов.
Контрольные вопросы
1.В чем заключается фундаментальная задача диагностики?
2.Какой признак называется дихотомическим?
3.Как выполнить дихотомию признаков?
4.Опишите структуру медицинской памяти.
5.Как определить вероятность заболевания по данным ТЭД?
6.Как определить вероятность проявления дихотомического признака по данным ТЭД?
7.Как определить условную вероятность проявления какого-либо признака при определенном диагнозе?
8.В каком случае условная вероятность наличия дихотомического признака при данном заболевании может быть равна 1 или 0?
9.Что такое детерминистская связь?
10.В чем смысл детерминистской связи первого рода?
11.В чем смысл детерминистской связи второго рода?
12.Из каких этапов состоит детерминистская логика?
13.В чем заключается первый этап диагностики?
14.В чем заключается второй этап диагностики?
15.Какова реакция диагностической системы в случае, когда невозможно определить точный диагноз?
43

4.СИНТЕЗ ДИАГНОСТИЧЕСКИХ ПРАВИЛ НА ОСНОВЕ ИНФОРМАЦИОННО-ВЕРОЯТНОСТНОЙ ЛОГИКИ
Цель работы: изучение информационных мер дихотомических признаков; синтез диагностических правил в КСМД, основанных на информационно-вероятностной логике.
Информационные меры дихотомических признаков
Как отмечалось в лабораторной работе 3, основной задачей диагностики является синтез критериев, позволяющих указывать, насколько тот или иной признак «симптоматичен» для данного заболевания. При информационном подходе такими мерами является диагностическая ценность признака, которая определяется информацией, вносимой признаком в систему состояний. Для определения диагностической ценности признака используются данные, хранящиеся в медицинской памяти системы (см. табл. 3.1), структура которой рассмот-
рена в лабораторной работе 3. |
|
|
|
|
|
|
|
|
|
|
||||||
|
Симптом – это количество информации, содержащееся в наличии |
|||||||||||||||
данного признака |
x j относительно заболевания |
Bi |
[8]: |
|
||||||||||||
|
|
|
|
|
|
P(B / s |
j |
) |
|
P(s |
j |
/ B ) |
|
|
||
|
|
|
Bi |
(s j ) log2 |
i |
|
log2 |
|
|
|
i |
, |
(4.1) |
|||
|
|
|
P(B ) |
|
|
P(s |
|
) |
||||||||
|
|
|
|
|
|
|
|
|
j |
|
|
|||||
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
где |
P(B / s |
j |
) – вероятность заболевания B |
при условии, что признак |
||||||||||||
|
i |
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
x j |
получил значение s j |
(апостериорная вероятность заболевания); |
||||||||||||||
P(Bi ) – априорная вероятность заболевания Bi |
; |
|
P(s j / Bi ) |
– вероят- |
||||||||||||
ность наличия признака |
x j |
при данном заболевании Bi ; |
P(s j ) – |
априорная вероятность наличия j-го признака в рассматриваемом классе заболеваний.
Из выражения (4.1) очевидно, что если наличие признака x j |
не |
|
изменяет вероятности заболевания Bi , то есть P(Bi |
/ s j ) P(Bi ) , |
то |
B (s j ) 0 , так как log2 1 0 . Если наличие признака |
|
|
x j увеличивает |
||
i |
|
|
44 |
|
|

вероятность заболевания |
Bi , то есть |
P(Bi / s j ) P(Bi ) , то |
B (s j ) 0 |
, |
|
|
|
i |
|
следовательно, это положительный симптом и наоборот, – если уменьшает, то отрицательный.
|
Соответственно, количество информации относительно заболева- |
|||||||||||||
ния |
Bi , содержащегося в отсутствии признака x j |
, |
определяется сле- |
|||||||||||
дующим образом: |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
P(s |
j |
/ B ) |
|
1 P(s |
j |
/ B ) |
|
||||
|
|
B (s j ) log2 |
|
|
|
i |
log2 |
|
|
|
i |
, |
||
|
|
P(s |
|
) |
1 P(s |
|
) |
|||||||
|
|
i |
|
|
|
|
||||||||
|
|
|
|
|
|
j |
|
|
|
|
|
j |
|
|
где |
P(s j / Bi ) |
– вероятность отсутствия признака |
x j |
|
при данном забо- |
|||||||||
левании Bi ; |
P(s j ) – априорная вероятность отсутствия j-го признака |
|||||||||||||
s j в рассматриваемом классе заболеваний. |
|
|
|
|
|
|
||||||||
|
Исходя из выше сказанного, в целом диагностическая ценность |
|||||||||||||
дихотомического признака |
x j относительно заболевания Bi , т. е. диа- |
гностический вес с учетом возможности его наличия и отсутствия,
определяется как |
B (x j ) P(s j / Bi ) B (s j ) P(s j |
/ Bi ) B |
(s j ) . Таким |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
i |
|
|
|
|
|
i |
|
|
|
|
|
|
образом, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
P(s |
j |
/ B ) |
|
|
|
|
|
|
|
1 P(s |
j |
/ B ) |
|
|
||||
|
|
(x |
|
) P(s |
|
/ B ) log |
|
|
|
|
i |
[1 |
P(s |
|
/ B )]log |
|
|
|
|
i |
. |
(4.2) |
|||||
Bi |
j |
j |
2 |
|
|
|
|
|
j |
2 |
|
|
|
|
|
||||||||||||
|
|
|
i |
|
P(s |
|
) |
|
|
i |
|
|
1 P(s |
|
) |
|
|||||||||||
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
j |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Пусть мы имеем систему m признаков |
R |
(m) |
. В соответствии с |
||||||||||||||||||||||
|
|
|
|
общим определением информационная мера признаков равна количе-
ству информации, содержащемуся в |
R |
(m) |
относительно заболевания |
|||||||||||||
|
||||||||||||||||
Bi : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P(B / R |
(m) |
) |
|
|
|
P(R |
(m) |
/ B ) |
|
|
|
|
|
|
(m) |
|
|
|
|
|
|
|
|
|||||
|
|
B (R |
) log2 |
i |
|
|
|
log2 |
|
|
i |
. |
(4.3) |
|||
|
|
|
P(B ) |
|
P(R(m) ) |
|||||||||||
|
|
i |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
Таким образом, количество информации, содержащееся в призна- |
|||||||||||||||
ке x |
|
(или системе признаков R |
(m) |
) |
относительно заболевания B , |
|||||||||||
j |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
равно количеству информации, содержащемуся в диагнозе |
Bi относи- |
|||||||||||||||
тельно признака x j |
(или системы признаков R(m) ). |
|
|
|
||||||||||||
|
|
|
|
|
45 |
|
|
|
|
|
|
|
|
|
Ни один дихотомический признак |
x j |
не может обладать сколько- |
нибудь существенной положительной информационной мерой (то есть информацией утвердительной), если он вообще значительно распространен среди больных, относящихся к данному классу заболеваний,
то есть вероятность P(s j ) близка к 1. И наоборот, – признак |
x j может |
|
обладать информацией, отвергающей |
данное заболевание |
Bi , если |
P(s j / Bi ) P(s j ) . С другой стороны, |
если вероятность заболевания |
достаточно высокая, то есть P(Bi ) |
близка к 1, то любая система при- |
знаков будет малоинформативной. |
|
Информационно-вероятностная логика
После проведения детерминистской логики получен список забо-
леваний |
B1, B2, , Bk , возможных при данной клинической картине |
больного |
Dmx(x1, , xm ) . Нужно установить, какое же заболевание |
верно. |
|
Информационно-вероятностная логика состоит из двух этапов [9]. Первый этап заключается в последовательном вычислении вероятностей, оставшихся после детерминистской логики заболеваний B1, B2, , Bk при данной системе признаков Dmx . Воспользуемся для этого информационными мерами признаков. Из выражения (4.3) полу-
чим:
log2 P(Bi / Dmx) B |
(Dmx) log2 |
1 |
B (Dmx) B , (4.4) |
|||
|
||||||
P(Bi ) |
||||||
|
i |
|
i |
i |
||
|
|
|
||||
где P(Bi / Dmx) – вероятность заболеваний |
B1, B2, , Bk |
при данной |
||||
системе признаков |
Dmx ; |
B (Dmx) – информационная мера системы |
||||
|
|
i |
|
|
|
|
признаков больного |
Dmx |
; B – информационная мера диагноза для |
||||
|
|
i |
|
|
|
оставшегося после детерминистской логики списка заболеваний. Вычисление Bi (Dmx) по информационным мерам отдельных
признаков, входящих в Dmx , производится для m независимых при-
46

знаков по выражению
|
m |
B |
(Dmx) B [Dmx(x j )] Dmx |
i |
i |
|
j 1 |
,
(4.5)
где |
B [Dmx(x j )] – информационная мера признака |
x j , входящего в |
|
i |
|
Dmx , при состоянии Bi . |
|
|
|
Надо отметить, что в большинстве практических задач, особенно |
при большом числе признаков, можно принимать условие независимости признаков даже при существенных корреляционных связях между ними.
|
С учетом (4.2) величина |
B [Dmx(x j )] |
определяется следующим |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
образом: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P(s |
j |
/ B ) |
|
|
|
|
|
|
P(s |
j |
/ B ) |
|
||||||||
|
|
|
[Dmx(x |
|
)] Dmx(s |
|
) log |
|
|
|
|
|
i |
Dmx(s |
|
) log |
|
|
|
|
|
|
i |
|
||||||||||||
|
B |
j |
j |
2 |
|
P(s |
|
) |
j |
2 |
|
P(s |
|
) |
||||||||||||||||||||||
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
|
|
P(s |
j |
/ B ) |
|
|
|
|
|
|
|
|
|
|
|
1 P(s |
j |
/ B ) |
|
|
||||||||||
|
|
|
Dmx(s |
|
) log |
|
|
|
|
|
i |
|
[1 Dmx(s |
|
)]log |
|
|
|
|
|
|
|
i |
|
, |
|
||||||||||
|
|
|
j |
2 |
P(s |
|
) |
|
j |
2 |
1 P(s |
|
) |
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где |
Dmx(s j ) , |
|
Dmx(s j ) |
– наличие и отсутствие признака |
|
x j |
|
при дан- |
||||||||||||||||||||||||||||
ной системе признаков больного |
Dmx |
соответственно. |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
В выражении (4.5) есть неопределенный член Dmx . Обозначим |
|
Dmx |
log |
2 |
A |
|
|
|
и подставим выражение (4.4) в (4.3):
m |
|
log2 P(Bi / Dmx) Bi [Dmx(S j )] Bi |
Dmx |
j 1 |
(4.6) |
|
log2 P (Bi / Dmx) Dmx log2 AP (Bi / Dmx).
Из выражения (4.6) очевидно, что неопределенный член Dmx окажется вычисленным, если провести операцию нормализации, приводящую к выполнению равенства
k |
|
P(Bi / Dmx) 1 . |
(4.7) |
i 1 |
|
Таким образом, операция нормализации состоит в умножении |
|
всех величин P (Bi / Dmx) на множитель А, |
так, чтобы условие (4.7) |
47 |
|
имело место.
После нормализации мы получили искомые величины вероятностей заболеваний при данной клинической картине больного P(Bi / Dmx) . После этого список возможных заболеваний можно расположить в порядке убывания вероятностей, на первом месте окажется наиболее вероятная гипотеза.
Второй этап информационно-вероятностной логики состоит в принятии решения. В этом решении играет роль не только то, что вероятность данного заболевания максимальна, но и то, что разность между вероятностью этого заболевания и следующего в порядке убывания вероятностей не меньше некоторого минимума. Эти два подхода можно объединить одним критерием – порогом Ti .
Установим для каждого заболевания некоторое число Ti , такое,
что если P(Bi / Dmx) Ti , то данное заболевание – диагноз. Сумма ве-
роятностей остальных заболеваний будет меньше 1 Ti . Таким обра-
зом, чем больше мы возьмем Ti , тем большим будет не только уровень оценки, но и разность между вероятностями того заболевания, которое мы приняли за диагноз, и следующего.
Если диагноз не поставлен, то необходимо пересмотреть систему признаков Dm , а затем вновь повторить этапы детерминистской и информационно-вероятностной логики. Эти действия повторяются до тех пор, пока не будет установлен диагноз.
Введенные пороги |
Ti |
имеют простой физический смысл. Пусть |
мы имеем n больных с одной и той же системой признаков |
Dmx . Всем |
им будет поставлен диагноз Bi , |
если |
P(Bi / Dmx) Ti . Однако часть их |
|||||||
n |
|
будет в действительности страдать другими заболеваниями. При |
|||||||
|
|||||||||
большом n эта часть |
n |
|
|
|
|
n[1 |
P(Bi / Dmx)] . |
||
|
равна n |
||||||||
|
|
Тогда относительное количество ошибок определяет точность |
|||||||
диагностики |
|
|
|
|
|
|
|
||
|
|
|
|
n |
1 P(B / Dmx) 1 T . |
||||
|
|
|
|
||||||
|
|
|
|
|
|
n |
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
Следовательно, |
1 Ti |
представляет собой максимальную относи- |
|||||
|
|
|
|
|
|
|
|
48 |
|

тельную погрешность в диагностике при установлении диагноза
Bi
.
Порядок выполнения лабораторной работы работы
1. Для выполнения работы необходимо использовать результа-
ты лабораторной работы 3:
файл memory_v#.* (медицинская память системы);
файл с дихотомическими признаками и списком возможных болезней для каждого из пациентов.
2. Для каждого пациента выполнить первый этап информацион-
но-вероятностной логики.
2.1. По коду Dmx данного больного вычислить информационные
меры отдельных признаков |
B [Dmx(x j )] |
|
i |
оставшихся после детерминистской логики,
для всех заболеваний
Bi
,
|
|
|
P(s |
j |
/ B ) |
|
|
1 P(s |
j |
/ B ) |
|
||||
|
B [Dmx(x j )] x j log2 |
|
|
|
i |
(1 |
x j ) log2 |
|
|
|
i |
, |
|||
|
P(s |
|
) |
1 P(s |
|
) |
|||||||||
|
i |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
j |
|
|
где |
P(s j / Bi ) |
– вероятность наличия j-го признака при данном заболе- |
вании |
Bi ; |
P(s j ) |
– априорная вероятность наличия j-го признака в рас- |
сматриваемом классе заболеваний; x j |
– значение j-го признака для |
рассматриваемого пациента. |
|
2.2. Вычислить P(Bi / Dmx) – вероятности оставшихся после де- |
|
терминистской логики заболеваний Bi |
при данной системе признаков |
Dmx . Для этого выполнить следующие шаги. |
|
2.2.1. Вычислить массив значений |
Li , элементы которого опреде- |
ляются по выражению |
|
Li
log |
2 |
P (B |
|
i |
m
/ Dmx) Bi [Dmx(x j )] log2 j 1
P(Bi )
,
где |
P(Bi ) – априорная |
|
2.2.2. Вычислить |
для всех заболеваний
вероятность заболевания Bi .
ненормализованные вероятности P (Bi / Dmx)
Bi , оставшихся после детерминистской логики
49