Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие 2011.docx
Скачиваний:
103
Добавлен:
10.12.2018
Размер:
3.14 Mб
Скачать
    1. Сегментация изображений

Сегментация – это процесс разбиения изображения на неперекрывающиеся области (сегменты), покрывающие все изображение и однородные по некоторому признаку. Все пиксели в сегменте похожи по некоторой характеристике или вычисленному свойству, например по цвету, яркости или текстуре. Соседние сегменты значительно отличаются по этой характеристике.

Цель сегментации заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать. Сегментация и выделение границ объектов играют важную роль в системах компьютерного зрения и применяются для задач распознавания сцен и выделения (определения) объектов.

Методы сегментации можно разделить на два класса: автоматические – не требующие взаимодействия с пользователем и интерактивные – использующие пользовательский ввод непосредственно в процессе работы. Например, к интерактивной сегментации можно отнести алгоритм инструмента «Волшебная палочка», реализованный во многих растровых редакторах.

Далее рассмотрим только автоматические методы. Задачи автоматической сегментации делятся на два класса:

  • выделение областей изображения с известными свойствами;

  • разбиение изображения на однородные области.

Между этими двумя постановками задачи есть принципиальная разница. В первом случае задача сегментации состоит в поиске определенных областей, о которых имеется априорная информация (например, мы знаем цвет, форму областей, или интересующие нас области представляют собой изображения известного объекта). Методы этой группы узко специализированы для каждой конкретной задачи. Сегментация в такой постановке используется в основном в задачах машинного зрения (анализ сцен, поиск объектов на изображении).

Во втором случае никакая априорная информация о свойствах областей не используется, зато на само разбиение изображения накладываются некоторые условия (например, все области должны быть однородны по цвету и текстуре). Так как при такой постановке задачи сегментации не используется априорная информация об изображенных объектах, то методы этой группы универсальны и применимы к любым изображениям. В основном сегментация в этой постановке применяется на начальном этапе решения задачи, для того чтобы получить представление изображения в более удобном виде для дальнейшей работы.

      1. Методы, основанные на кластеризации

В постановке задачи сегментации прослеживается аналогия с задачей кластеризации1. Для того чтобы свести задачу сегментации к задаче кластеризации, достаточно задать отображение точек изображения в некоторое пространство признаков и ввести метрику (меру близости) на этом пространстве признаков. В качестве признаков точки изображения можно использовать представление ее цвета в некотором цветовом пространстве, примером метрики (меры близости) может быть евклидово расстояние между векторами в пространстве признаков.

После сведения задачи сегментации к задаче кластеризации можно воспользоваться любыми методами кластерного анализа. Наиболее популярные методы кластеризации, используемые для сегментации изображений – метод к-средних.

Алгоритм k-средних — это итеративный метод, который используется, чтобы разделить изображение на K кластеров. Опишем словесно алгоритм следующим образом:

  1. Выбрать K центров кластеров, случайно или на основании некоторой эвристики.

  2. Поместить каждый пиксель изображения в кластер, центр которого ближе всего к этому пикселю.

  3. Заново вычислить центры кластеров, усредняя все пиксели в кластере.

  4. Повторять шаги 2 и 3 до сходимости (например, когда пиксели будут оставаться в том же кластере).

Здесь в качестве расстояния обычно берётся сумма квадратов или абсолютных значений разностей между пикселем и центром кластера. Разность обычно основана на цвете, яркости, текстуре и местоположении пикселя, или на взвешенной сумме этих факторов. K может быть выбрано вручную, случайно или эвристически.

Этот алгоритм гарантированно сходится, но он может не привести к оптимальному решению. Качество решения зависит от начального множества кластеров и значения K.

Применить метод k-средних к изображению можно рассматривая пространство яркостей пикселей. В этом случае кластеризация является одномерной задачей по одному признаку – яркости. Одномерное пространство яркостей пикселей, хорошо представимо гистограммой (Рис. 5 .49).

а)

б)

в)

Рис. 5.49. Применение k-средних для сегментации изображений по яркости

Для приведенного изображения (Рис. 5 .49, а) метод k-средних для K равного двум определит два кластера с центрами в точках C1 и С2 (Рис. 5 .49, б), и изображение будет разделено на два сегмента, закрашенных черным и белым цветом (Рис. 5 .49, в). В этом случае можно сказать, что метод k-средних провел пороговую фильтрацию и получил бинарное изображение.

Одна из проблем методов кластеризации, состоит в том, что пространственное расположение точек либо не учитывается совсем, либо учитывается косвенно (например, используя координаты точки как один из признаков). Поэтому обычно после кластеризации точек изображения проводят процедуру выделения связных компонент.

Методы кластеризации, также, плохо работают на зашумленных изображениях: часто теряют отдельные точек регионов, образуется много мелких регионов, и. т. п.

Подобные результаты, приведенные выше (Рис. 5 .49), можно получить, не используя методов кластерного анализа. В этом случае используется анализ гистограммы. При этом гистограмма вычисляется по всем пикселям изображения и её минимумы и максимумы используются, чтобы найти сегменты на изображении.

Методы с использованием гистограммы очень эффективны, когда сравниваются с другими методами сегментации изображений, потому что они требуют только один проход по пикселям. Недостатком таких методов является дискретная природа гистограммы, что затрудняет поиск значительных минимумов и максимумов на ней.