Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глаголев.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
5.4 Mб
Скачать
    1. Сегментация изображения в системе технического зрения

Основной задачей анализа и обработки изображения является сегментация. Другими словами это разбиение изображения на части, в которых выполняется некий критерий однородности. Одним из способов сегментации изображения является бинаризация изображения.

      1. Бинаризация изображения в системе технического зрения

Бинаризацией изображения можно назвать процесс перевода цветного изображения или изображения в градациях серого в монохромное. Монохромное (черно-белое) изображения состоит черных или белых пикселей и место необходимое под хранение одного пикселя составляет 1 бит, тогда как у цветного это 24 бита. Следовательно работа с бинаризованным изображением будет быстрее. Существуют два типа бинаризации:

  • Пороговая бинаризация

Пороговая бинаризация имеет несколько видов:

  • Бинаризация с одним уровнем:

Является одним из самых простых способов бинаризации. Она бывает как с верхним порогом, либо с нижним порогом. В первом случае отсеиваются (приравниваются «0») все пиксели, находящиеся выше порога бинаризации. Во втором случает отсеиваются все пиксели, находящиеся ниже порога. В метаматематическом выражение это будет иметь вид:

Таблица 2 – математическое представление бинаризации с одним порогом

Бинаризация с нижним порогом

Бинаризация с верхним порогом

Рисунок 17 – Пример работы алгоритма бинаризации с нижним и верхним порогом

  • Бинаризация с двойным порогом:

Для данного вида бинаризации характерно выделение некоторой области, в которой яркость пикселя может меняться. В математическом выражение это будет иметь вид:

  • Многоуровневая бинаризация:

Для этого вида бинаризации характерна выделение некоторых областей интенсивностей пикселей. В математическом выражение это будет иметь вид:

  • Неполная бинаризация:

Этому виду бинаризации характерно отсеивание не нужных пикселей. Пиксели, которые нам интересны, не меняют своего значения. Это делается для дальнейшей обработки интересуемой нас области. В математическом выражение это будет иметь вид:

Рисунок 18 – Неполная бинаризация

  • Адаптивная бинаризация:

Адаптивная бинаризация изображения работает при помощи локальных или глобальных гистограммах изображения. Основное отличие от пороговой бинаризации является варьируемый порог, который рассчитывается в зависимости от параметров. В данном алгоритме расчет порога в некоторой области (далее области H), которую задает пользователь, идет по формуле предложенной Ниблаком:

, где T – порог, M – математическое ожидание, посчитанное для области H, D – дисперсия, посчитанная для пикселей области H, K – некоторая константа. Значение пикселя равно нулю если оно меньше порога, единице, если больше. Работа данного алгоритма очень сильно зависит от параметров, необходимых для его работы. Следовательно и разный результат его работы:

Рисунок 19 – исходное изображение.

Рисунок 20 – Пример работы адаптивной бинаризации при размере блока равной 3 пикселя

Рисунок 21 – Пример работы адаптивной бинаризации при размере блока равной 25 пикселей

Так же нельзя забывать, что в нашей задаче очень важно быстродействие системы. В данном случае адаптивный алгоритм бинаризации работает на много медленнее чем обычный пороговый.

Так же для улучшения результата бинаризации можно совместить два метода: пороговую и адаптивную. Первый даст там исключение шумов на изображение, второй же поможет нам более явно выделить необходимые нам объекты.

Рисунок 20 – пример работы гибридного алгоритма бинаризации.

Проанализировав методы бинаризации, было решено, что для решения нашей задачи подходит пороговая бинаризация. Данный выбор был сделан исходя из того, данному типу бинаризации необходимо меньше время на его выполнение (это отразится на быстродействие системы), а так же простота реализации алгоритма. После выполнения данного алгоритма данные, полученные с камеры изменились: с матриц RGB размером 480х360 на бинарную матрицу того же размера. Данное преобразование ускоряет работу системы, так как было произведено уменьшение объема данных, получаемых с камеры и выделяет объект.

Рисунок 21 – Пример работы алгоритма бинаризации.