Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Максимова.doc
Скачиваний:
10
Добавлен:
01.04.2025
Размер:
20.86 Mб
Скачать

6.1.5. Алгоритмы разметки точек смешанного типа

Ранее были рассмотрены два принципиально различных метода разметки точек: порогового ограничения и метод наращивания областей. В конкретных условиях часто имеет смысл частично применять алгоритмы как одного, так и другого подходов. Проведем анализ некоторых возможностей в этом направлении.

Как было отмечено выше полная сегментация методом порогового отсечения возможна лишь при определенных условиях, накладываемых на интервалы изменения яркости в точках объектов и фона. Эти условия на практике выполняются редко, так что пороговым отсечением чаще можно добиться грубой или многозначной разметки точек. Для построения окончательной разметки необходимо пороговое отсечение дополнить локальным алгоритмом типа наращивания областей. Если пороговое отсечение дает грубую разметку, то окончательная сегментация осуществляется раскраской бинарного изображения, в котором черные точки соответствуют точкам области объектов. Остановимся подробнее на том случае, когда пороговым отсечением можно получить многозначную разметку точек. Пусть M – оператор многозначной разметки. В соответствии с используемыми обозначениями, M – правило, по которому каждой точке (i, j) сопоставляется подмножество M (i, j) множества индексов {1,..., s},  (i, j) – число, на единицу меньшее, чем число индексов множества M (i, j) (показатель неоднозначности разметки). Через D0 обозначим множество точек (i, j) для которых (i, j) = 0, т. е. разметка в точке (i, j) однозначная.

Очевидно, множество D0 имеет смысл выбрать в качестве множества стартовых точек для алгоритма центроидного связывания. Разметка точек D0 определена отображением M. Разметка остальных точек осуществляется тем же способом, что и при обычном применении алгоритмов центроидного связывания, c той лишь разницей, что учитывается информация о построенном многозначном отображении M.

Следует отметить, что информация о многозначной разметке существенно повышает как надежность, так и быстродействие алгоритма центроидного связывания.

Указанный способ комбинирования различных методов разметки эффективен, если имеется некоторая информация о яркости объектов в поле зрения D. Можно привести ряд других способов комбинирования алгоритмов порогового ограничения и алгоритмов наращивания областей, в том числе таких, когда первыми применяются алгоритмы наращивания областей. С помощью алгоритма cлияния-расщепления удается получить достаточно однородную по яркости область Q D причем площадь Q сравнима с площадью D. Если известно, что в изображении преобладает фон, то информацию о яркости точек Q можно преобразовать в информацию, необходимую для реализации метода порогового ограничения, чтобы получить грубую сегментацию. Таким образом, указанный подход заключается в применении трех алгоритмов – сначала локального алгоритма слияния-расщепления, затем глобального алгоритма порогового ограничения и, наконец, локального алгоритма раскраски.

Другое применение локальных алгоритмов для повышения эффективности метода порогового ограничения заключается в «локальном» анализе гистограммы. Изображение в поле зрения D разбивается на фрагменты, для каждого из фрагментов строится своя гистограмма и выбирается порог, разделяющий яркости объектов и фона. Пусть (i1, j1), ..., (i, j) – центры фрагментов. Построим функцию Т(i, j), определяя ее в точках (ik, jk), k = 1,…, значениями найденных порогов, а в остальных точках (i, j) D – с помощью двумерной интерполяции. Значения Т(i, j) могут при этом не совпадать даже в близких точках. После построения функции Т(i, j) алгоритм порогового ограничения совсем прост – точка (i, j) принадлежит области объектов в том и только в том случае, если ее яркость меньше Т(i, j) (или больше Т(i, j), когда фон темнее объектов).

Укажем еще один интересный прием, позволяющий повысить эффективность алгоритмов центроидного связывания с помощью информации о распределении яркости. Важно, что для его реализации не требуется никаких априорных сведений о соотношении яркостей объектов и фона.

Идея подхода заключается в анализе поведения специальной функции f(i, j, n). Пусть (i, j)D – фиксированная точка, и необходимо определить, относится она к фону или к области объектов (для грубой сегментации). Значение f(i, j, n) равно числу точек связной области, содержащей точку (i, j) для которых яркость не превышает n. Если (i, j) принадлежит области некоторого объекта, то f(i, j, n) как функция n носит ярко выраженный ступенчатый характер.

Рассмотрим распределение яркости на рис. 6.10. а. Зафиксируем точку (i, j) яркость в которой равна 7. Поскольку любое связное множество, содержащее точку (i, j), имеет точки с яркостью выше, чем 6, то f(i, j, n) = 0 при n  6. Связное множество, содержащее точку (i, j) и обладающее тем свойством, что яркость в его любой точке не выше 7, состоит, очевидно, из девяти точек, так что f(i, j, 7) = 9. Аналогично f(i, j, 8) = 18, f(i, j, 9) = 27, f(i, j, 10) = 36. Теперь ясно, что при любом n 10 связное множество, содержащее точку (i, j) состоит из всех точек, представленных на рис. 6.10. а, с ненулевой яркостью. Рост функции f(i, j, n) прекращается: f(i, j, n) = 36 при любом n 10 (рис. 6.10. б).

Рис. 10. Вид функции f(i, j, n) для модельного изображения

Для нахождения локального порога определяется значение n0, при котором прекращается резкий рост f(i, j, n). Зная n0 можно найти сразу всю область объекта, содержащего точку (i, j) – это связное множество точек, яркость в которых не превышает n0. Указанный алгоритм удачно сочетает достоинства локальных и глобальных методов при отсутствии дополнительной априорной информации, легко реализуется на практике в связи с простым алгоритмическим построением функции f(i, j, n).

Конечно, существуют и другие подходы для построения алгоритмов смешанного типа, однако приведенные алгоритмы, вероятно, наиболее перспективны в задачах, связанных с СТЗ роботов.

Основным критерием для выбора алгоритма сегментации является, в конечном счете, надежность, определяемая вероятностью правильной сегментации. Для данного класса изображений надежность зависит в первую очередь от правильности и полноты учета априорной информации. К сожалению, накоплено слишком мало опыта по сравнению алгоритмов на различных изображениях. Хотелось бы уметь производить разбиение класса входных изображений М на подклассы М = М1 U ... U Мk так, чтобы для подкласса Мj, j = 1, ..., k алгоритм с номером j (при некоторой нумерации) был оптимален по тому или иному критерию – надежности, времени реализации, объему требуемой памяти. Такое разбиение в настоящее время еще проблематично, и соответствующая идеология не разработана.

Кроме возможности объективной оценки алгоритмов существует еще субъективный подход, выражающий личную точку зрения ряда разработчиков, основанную на опыте и некоторых плохо формализуемых предпосылках. В рамках такого субъективного подхода перспективными можно считать двухэтапные алгоритмы, которые на первом шаге «устраняют» фон, а на втором шаге области идентифицируют объекты с помощью раскраски бинарного изображения. Это мнение основано на том, что алгоритмы раскраски бинарных изображений, вероятно, единственные алгоритмы сегментации, не основанные на эвристических соображениях.