книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа
..pdf10.4. Триплетные признаки в ультразвуковых исследованиях |
2 2 1 |
качестве исходных данных в этом алгоритме используется семейство порождающих множеств { К } решётки L f и ещё, может быть, мно жество S = U К , расширяющее (доопределяющее) семейство { К } .
к е { к }
Исходные и результирующие данные алгоритма удовлетворяют услови ям {К} С 2s , |{А'}| = то < 21s !, (А е Lf) -фф- {А = f ) К а )- Обоснование алгоритма и оценка его трудоемкости приводятся в работе [115]. Алго ритм является сходящимся и строит решетку, общее число элементов
в которой не превышает величины
< |5| или величины min{2m,2"} при п = 151, где т = \{К}\, п = = max \К\, { К } — семейство порождающих множеств решётки L f
ке { к }
иS = [J К [115]. В практических задачах анализа ассоциаций обычно
выполняются условия то |
те и п < |5|, тогда трудоемкость алгоритма |
|
построения решетки Lf |
определяется величиной О |
, кото |
рая уменьшается при учете ограничений на мощность элементарных классификаторов.
Таким образом, применение методов стохастической геометрии и методов КУМ для решения задачи распознавания гистологических изображений позволяет повысить эффективность ранней диагности ки онкологических заболеваний. В частности, рассмотренный метод дискретной классификации описаний изображений позволяет повысить эффективность решения задач за счет использования введенных отно шений частичного упорядочения на множестве элементарных класси фикаторов. Метод дает адекватную модель структуры данных и поз воляет использовать достаточно развитый аппарат теории решеток для аналитического исследования свойств элементарных классификаторов. Метод представляет модель в достаточно компактном и наглядном виде.
10.4. Экстракция триплетных признаков ультразвуковых исследований
Предварительная обработка ультразвуковых исследований изображений. Ультразвуковые исследования являются базовым методом диагностики заболеваний щитовидной железы. Автоматизация этого процесса сталкивается с объективными трудностями, для преодоления которых разработана процедура предварительной обработки, предшествующая распознаванию [64, 95].
Рассмотрим два основных этапа обработки ультразвуковых снимков:
—сегментация области щитовидной железы на УЗИ снимках;
—выделение очаговых образований на области щитовидной же
лезы.
10.4. Триплетные признаки в ультразвуковых исследованиях |
223 |
На рис. 10.5, а дано исходное изображение.
Как видно из рисунка 10.5,6, выделенное подмножество представ ляет собой окружающую среду щитовидной железы и не представляет интереса для исследования. Второе подмножество (рис. 10.1, в, см. цветную вклейку) представляет собой непосредственно щитовидную железу, также есть еще несколько подмножеств, представляющих со бой некоторый шум (рис. 10.1, г, см. цветную вклейку), которые могут быть как частью окружающей среды, так и частью самой железы. Из результата видно, что выбранный оптимальный диаметр подмножеств является достаточно малым для относительно точного выделения близ кого к черному цвета окружающей среды, но недостаточно большим для точного выделения всей щитовидной железы.
Данное заключение позволяет сделать вывод, что для повышения информативности результата анализ снимка следует проводить в нес колько шагов. Высокая скорость работы алгоритма позволяет исполь зовать его несколько раз подряд для решения одной задачи.
Одним из подходов является проведение после каждого шага рабо ты алгоритма двух операций, назовем их «исключением несвязностей» и «рекурсией».
Первая операция — исключение несвязностей — заключается в следующем. После обработки снимка мы получаем набор подмножеств точек, в большинстве случаев представляющих собой несвязные об ласти. Вследствие этого в случаях, когда щитовидная железа имеет внутри себя некоторые образования, изображенные на снимке цве том, близким к черному, т. е. к цвету окружающей среды, данные образования будут относиться к подмножеству окружающей среды. Но данные образования представляют интерес для исследования, и исключение несвязностей позволит объединить их с изображением щитовидной железы. Также некоторые элементы снимка, выделенные в отдельный объект — подмножество, но не являющиеся таковым, могут объединиться с некоторым классом и этим понизить количество шумов.
Исключение несвязностей предполагается производить следующим образом:
—каждую связную область выделенного множества представить в виде его подмножества;
—сравнить процентную составляющую площади каждого подмно жества от площади всего снимка, и если она превышает наперед заданное значение, то данное подмножество можно считать отдельным объектом. В противном случае это подмножество следует объединить
собъектом, окружающим его.
В результате мы получим разбиение снимка на подмножества, представляющие собой связные области, после чего можно приступать к рекурсии.
Рекурсия представляет собой:
— удаление из исходного снимка самого четкого подмножества, не являющегося щитовидной железой;
228 Гл. 10. Распознавание сложноструктурированных изображений
стве функционала 0 выберем среднее арифметическое. Полученный числовой признак будет представлять собой числовую оценку неров ности границы объекта. Ровную границу очага будут характеризовать значения признака, близкие к единице; неровную — значения, суще ственно большие единицы.
Описанный подход был протестирован на наборе ультразвуковых изображений для 70 различных пациентов, полученных методом «сво бодной руки».
10.5. Применение параллельных вычислений при решении задач распознавания на основе
стохастической геометрии и функционального анализа
На современном этапе производители процессоров столкнулись с технологическими сложностями дальнейшего наращивания тактовой частоты. В качестве альтернативного способа увеличения производи тельности в сегменте персональных компьютеров появились многоядер ные процессоры. На сегодняшний день уже существуют двух- и четырехядерные модели, аналитики прогнозируют дальнейшее увеличение количества ядер.
Появление многоядерных процессоров, в первую очередь, отрази лось на производителях программного обеспечения. Теперь производи тельность программы определяется не только эффективностью алго ритма, но и эффективным использованием параллельных вычислений, применение которых позволяет полностью использовать вычислитель ные ресурсы системы.
Далеко не все алгоритмы допускают эффективное распараллелива ние. Разработчикам программ с большой вычислительной сложностью необходимо либо искать новые алгоритмы решения задач, либо распа раллеливать существующие вычислительные схемы.
Рассмотрим возможность применения параллельных вычислений в задачах распознавания образов методом стохастической геометрии. Ориентируясь на современные аппаратные средства, необходимо по строить нераспределенную систему распознавания образов, порожда ющую не менее четырёх эффективных потоков (что соответствует наибольшему числу ядер на сегодняшний день).
Переход от однопоточной системы к параллельной обычно сводится к применению многопоточных вычислений в наиболее ресурсоемких операциях. Такой подход вытекает из требований, предъявляемых к многопоточным вычислениям:
• минимальные расходы вычислительных ресурсов на управление потоками (другими словами, затраты машинных ресурсов на порожде ние, удаление и переключение между потоками должны быть мини мальными);
• минимизация времени ожидания потока (синхронизация потоков приостанавливает их выполнение);
230Гл. 10. Распознавание сложноструктурированных изображений
•конвейерное вычисление (в результате работы одного потока фор мируются исходные данные для другого потока),
•смешанная схема (применяется только при очень большом коли честве потоков).
Для нашей задачи больше всего подходит первая схема, так как она обычно проще в реализации и не приводит к длительной приостановке выполнения потоков при синхронизации.
Необходимо отметить, что возможно организовать параллельное вычисление всего дерева функционалов, но данный подход будет неэф фективен при наличии всего одного Т функционала и приведет к увеличению необходимого количества оперативной памяти приблизи тельно на 40%, что неприемлемо для больших изображений. Поэтому в дальнейшем рассматривается только возможность применения па раллельных вычислений в рамках одной операции, не приводящего к значительному увеличению необходимого количества памяти.
Для реализации вычислений в параллельных потоках необходимо разделить обрабатываемые исходные данные на равные части, коли чество частей определит количество эффективных потоков. В задачах распознавания образов на основе стохастической геометрии и функци онального анализа сканирующие прямые формируются для множества углов (оно определяется настройками системы и обычно составляет 0°-360° с шагом 10°). Множество сканирующих прямых, найденных для определенного угла, является исходным для потока, вычисляющего значение Т функционала.
Далее необходимо осуществить эффективное управление потоками. Количество порождаемых потоков не должно быть жестко детерми
нированным, так как это приведет к ухудшению производительности в случае несовпадения количества процессоров с количеством порож денных потоков. Все сканирующие прямые хранятся в одном объекте и их количество известно. Легко добавить в данный класс метод, возвращающий множество необработанных сканирующих прямых или null, если все сканирующие прямые переданы на обработку. Получение потоком вместо исходных данных null приведет к его удалению. Ре зультаты вычисления передаются объекту класса t_result. Все резуль таты вычислений хранят угол, для которого было сформировано данное множество сканирующих прямых, поэтому не составляет сложности отсортировать сформированные данные в классе хранения результата, определить прогресс выполнения вычислений и задать событие окон чания вычислений.
Простейшая оболочка для многопоточных вычислений представлена на рис. 10.14.
В результате профилирования новой системы (использовались два потока, на двухядерном процессоре) были получены следующие резуль таты:
вычисление Т функционала и 85%, вычисление Р функционала и 15%, вычисление © функционала < 1 %.