
- •Оглавление
- •Глава 1. Факторы, повышающие риск возникновения рака молочной железы 8
- •Глава 2. Методика диагностики рака молочной железы по данным комбинированной термометрии 13
- •Глава 3. Экспертная база данных 19
- •Введение
- •На тестовой выборке 1: точность – 87,6%, специфичность – 85% и чувствительность – 88%.
- •Глава 4. Влияние физиологических факторов на данные комбинированной термометрии
- •Глава 5. Алгоритм нахождения высокоинформативных диагностических признаков
- •5.1. Выявленные ранее признаки в маммологии
- •5.2. Поиск признаков
- •Глава 6. Характеристические признаки заболеваний молочной железы
- •Глава 7. Алгоритм классификации пациенток по данным комбинированной термометрии
- •7.1. Алгоритм диагностики. Критерий классификации. Критерии оценки эффективности алгоритма
- •7.2. Минимизация набора высокоинформативных признаков для первого алгоритма
- •7.3. Проверка алгоритма диагностики на тестовых выборках
- •Для признаков из минимизированного набора были рассчитаны новые интервалы и, соответствующие им, информативности при помощи алгоритма диагностики, описанного в параграфе 7.1.
- •Также был найден новый критерий . В результате диагностики на тестовой выборке 1 была получена точность 87,6%, специфичность – 85% и чувствительность 88%.
- •В результате диагностики на независимой тестовой выборке 2 была получена чувствительность 91,5%.
- •Приложение
7.2. Минимизация набора высокоинформативных признаков для первого алгоритма
Получив критерий диагностики, стоит отметить, что точность диагностики здоровых пациенток (специфичность) оставляет желать лучшего. Одной из причин последнего является недостаточно оптимальный выбор используемых диагностических признаков. Было решено, с помощью вычислительных экспериментов произвести поиск более эффективного набора признаков.
При использовании первоначального набора высокоинформативных признаков с выбранным критерием классификации, в результате диагностики была достигнута точность в 89,5%, специфичность– 75%, чувствительность – 91,9%.
Минимизация набора происходила следующим образом:
Шаг 1. Берем два высокоинформативных признака.
Шаг 2. Проводим по выбранным признакам диагностику.
Шаг
3. Фиксируем специфичность
и чувствительность
,
полученные в результате диагностики.
Вычисляем
.
Шаг 4. К выбранным признакам добавляем следующий по информативности признак.
Шаг 5. Проводим диагностику.
Шаг
6. Фиксируем специфичность
и чувствительность
.
Вычисляем
.
Шаг
7. Если
,
то признак остается в наборе, иначе
признак исключается.
Шаг 8. Повторяются шаги с 4-7.
В результате применения указанного выше алгоритма был получен следующий набор признаков.
Таблица 16 – Признаки для алгоритма классификации
№ |
Признак |
|
Диапазон измерения |
Комбинированная информативность |
1 |
|
-0,75 |
РТМ |
12,2 |
2 |
|
-0,55 |
РТМ |
10,3 |
3 |
|
0,9 |
|
9,8 |
4 |
|
1,2 |
РТМ |
9,7 |
5 |
|
-0,75 |
РТМ |
9,0 |
6 |
|
1,3 |
РТМ |
9,0 |
7 |
|
0,41 |
РТМ |
8,5 |
8 |
|
-0,6 |
РТМ |
8,5 |
9 |
|
-0,95 |
РТМ |
8,3 |
10 |
|
0,69 |
РТМ |
7,1 |
11 |
|
1 |
|
6,1 |
12 |
|
0,36 |
ИК |
6,1 |
13 |
|
0,86 |
ИК |
6,0 |
14 |
|
0,9 |
ИК |
5,9 |
15 |
|
-0,65 |
ИК |
5,3 |
16 |
|
-0,71 |
ИК |
4,4 |
17 |
|
1,25 |
ИК |
4,2 |
18 |
|
0,7 |
|
3,8 |
19 |
|
0,8 |
|
3,8 |
20 |
|
-0,39 |
РТМ |
3,8 |
21 |
|
-0,62 |
ИК |
3,6 |
Затем,
с помощью алгоритма описанного в
предыдущем параграфе, был найден новый
критерий
.
Таким образом, при выполнении неравенства
молочная железа будет относиться к
классу «Больные», в противном случае –
к классу «Здоровые».
При проверке на обучающей выборке из 550 молочных желез пациенток (80 молочных желез здоровых пациенток и 470 молочных желез пациенток с заболеваниями молочных желез) на основе 21 признака, была достигнута точность – 90,9%, специфичность – 85% и чувствительность – 91,9%.
7.3. Проверка алгоритма диагностики на тестовых выборках
Алгоритм с использованием минимизированного набора признаков был проверен на тестовых выборках.
В связи с малым количеством данных выборка была поделена на обучающую и тестовую (тестовая выборка 1) случайным образом. Выборка была разделена следующим образом: в обучающую выборку были включены молочные железы двух классов: молочные железы здоровых пациенток (40 молочных желез) и молочные железы больных пациенток (234 молочных железы). В тестовую выборку 1 отнесли молочные железы, которые не были включены в обучающую. Тестовую выборку 1 составляют молочные железы двух классов: здоровые молочные железы здоровых пациенток (40 молочных желез) и молочных желез больных пациенток (236 молочных желез).