Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Диплом_v_7_3.docx
Скачиваний:
14
Добавлен:
25.03.2016
Размер:
359.22 Кб
Скачать

7.2. Минимизация набора высокоинформативных признаков для первого алгоритма

Получив критерий диагностики, стоит отметить, что точность диагностики здоровых пациенток (специфичность) оставляет желать лучшего. Одной из причин последнего является недостаточно оптимальный выбор используемых диагностических признаков. Было решено, с помощью вычислительных экспериментов произвести поиск более эффективного набора признаков.

При использовании первоначального набора высокоинформативных признаков с выбранным критерием классификации, в результате диагностики была достигнута точность в 89,5%, специфичность– 75%, чувствительность – 91,9%.

Минимизация набора происходила следующим образом:

Шаг 1. Берем два высокоинформативных признака.

Шаг 2. Проводим по выбранным признакам диагностику.

Шаг 3. Фиксируем специфичность и чувствительность, полученные в результате диагностики. Вычисляем.

Шаг 4. К выбранным признакам добавляем следующий по информативности признак.

Шаг 5. Проводим диагностику.

Шаг 6. Фиксируем специфичность и чувствительность. Вычисляем.

Шаг 7. Если , то признак остается в наборе, иначе признак исключается.

Шаг 8. Повторяются шаги с 4-7.

В результате применения указанного выше алгоритма был получен следующий набор признаков.

Таблица 16 – Признаки для алгоритма классификации

Признак

Диапазон измерения

Комбинированная информативность

1

-0,75

РТМ

12,2

2

-0,55

РТМ

10,3

3

0,9

9,8

4

1,2

РТМ

9,7

5

-0,75

РТМ

9,0

6

1,3

РТМ

9,0

7

0,41

РТМ

8,5

8

-0,6

РТМ

8,5

9

-0,95

РТМ

8,3

10

0,69

РТМ

7,1

11

1

6,1

12

0,36

ИК

6,1

13

0,86

ИК

6,0

14

0,9

ИК

5,9

15

-0,65

ИК

5,3

16

-0,71

ИК

4,4

17

1,25

ИК

4,2

18

0,7

3,8

19

0,8

3,8

20

-0,39

РТМ

3,8

21

-0,62

ИК

3,6

Затем, с помощью алгоритма описанного в предыдущем параграфе, был найден новый критерий . Таким образом, при выполнении неравенствамолочная железа будет относиться к классу «Больные», в противном случае – к классу «Здоровые».

При проверке на обучающей выборке из 550 молочных желез пациенток (80 молочных желез здоровых пациенток и 470 молочных желез пациенток с заболеваниями молочных желез) на основе 21 признака, была достигнута точность – 90,9%, специфичность – 85% и чувствительность – 91,9%.

7.3. Проверка алгоритма диагностики на тестовых выборках

Алгоритм с использованием минимизированного набора признаков был проверен на тестовых выборках.

В связи с малым количеством данных выборка была поделена на обучающую и тестовую (тестовая выборка 1) случайным образом. Выборка была разделена следующим образом: в обучающую выборку были включены молочные железы двух классов: молочные железы здоровых пациенток (40 молочных желез) и молочные железы больных пациенток (234 молочных железы). В тестовую выборку 1 отнесли молочные железы, которые не были включены в обучающую. Тестовую выборку 1 составляют молочные железы двух классов: здоровые молочные железы здоровых пациенток (40 молочных желез) и молочных желез больных пациенток (236 молочных желез).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]