Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Переработанные лекции (1)

.pdf
Скачиваний:
12
Добавлен:
31.03.2015
Размер:
1.26 Mб
Скачать

E

u E u i

 

 

L1 x m i p

x ,

 

i

 

 

 

 

 

 

1

u

 

 

 

 

 

 

 

 

 

 

 

x0

 

 

 

Абсолютные центральные моменты:

 

 

 

 

 

 

 

 

 

 

L1

 

 

 

ˆ

i

E

 

 

i

 

 

1

u

x ,

 

 

u

E u

 

 

 

x m

i p

Энтропия:

 

 

 

 

 

 

x0

 

 

 

 

 

 

 

 

 

 

 

 

 

i1, 2,...

i1, 2,...

 

 

L1

 

 

 

pu x log2

pu x

H E log2

pu x

 

 

x0

 

Наиболее распространенные признаки гистограммы:2 — дисперсия

m1 — средняя величина m2 — энергия

3 — асимметричность распределения относительно моды (skewness)

4 3 — эксцесс (kurtosis)

А также МЕДИАНА (среднее значение из ранжированного ряда) и МОДА (наиболее вероятное значение).

Часто эти признаки рассчитывются не для всего изображения (полной гистограммы), а только для локальных участков, выделяемых некоторым окном, например:

m

k,l

1

 

 

 

u m k, n l i

 

 

 

 

 

 

 

i

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W

 

 

 

 

 

 

 

 

 

 

m,n W

 

 

 

 

k,l

1

 

 

u m k, n l

m

k,l i

 

 

i

 

 

N

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

W

 

 

 

 

 

 

 

 

 

 

m,n W

 

 

 

Выделение спектральных (Фурье) признаков

Для выделения (усечения) некоторой спектральной области применяют так называемые зональные фильтры (маски), имеющие простейшую геометрическую форму в Фурье-пространстве — прямоугольник, кольцо, треугольник, круг.

В общем случае, признаки высокочастотные могут быть использованы для выделения контуров и границ объектов, щелевые маски, ориентированные под определенным углом, могут быть использованы для выделения объектов, соответствующим образом повернутых в пространстве.

Например, изображение, содержащее множество параллельных линий с ориентацией под углом , будет содержать в Фурье-пространстве наиболее интенсивные по энергии линии, ориентированные под углом + /2 и сконцентрированные в начале координат.

Определение границ объектов на изображении

Выделение контуров

Наиболее важная операция, предшествующая сегментации, идентификации и классификации объектов на изображении.

Интуитивно — всякая точка (пиксель) на изображении, находящаяся в области резкого изменения интенсивности (уровня серого), может быть отнесена к контурной точке.

Одним из наиболее очевидных и простых способов обнаружения границ является дифференцирование яркости, рассматриваемой как функция пространственных координат. То, что дифференцирование дает желаемый эффект, видно из простого «одномерного» примера.

Для двумерной непрерывной функции ее производная в точке указывает на направление в сторону максимального значения, а перпендикулярное ему направление — будет определять направление контура:

f

 

f x

 

f y

fx cos f y sin

r

 

x r

 

y r

 

Максимальное значение производной обеспечивается условием:

f 0r

Это приводит к уравнению для угла направления:

fx sin g

f y cos g

0

 

g

tan 1

 

f

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fx

 

f

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

fx

f y

 

 

 

 

 

 

 

 

 

r max

 

 

 

 

 

 

 

 

 

 

 

 

Где g — определяет направление контура.

Задача — найти эквивалентные этой формуле (дискретные) цифровые операторы.

Градиентные операторы

Градиент — это вектор (в нашем случае в двумерном пространстве), ориентированный по направлению наиболее быстрого возрастания функции f(x1, x2) и имеющий длину, пропорциональную этой максимальной скорости (максимальному значению частной производной по направлению).

Функция оценки градиента дискретного двумерного изображения может выполняться с помощью двух масок, наложение которых на изображение позволяет определить значение производной в двух взаимно перпендикулярных направлениях.

g m, n g12 m, n g22 m, n

 

 

tan 1

g2

m, n

g

g1

m, n

 

 

 

 

 

Часто значение производной оценивается по формуле: g m, n g1 m, n g2 m, n

Наиболее часто применяемые операторы:

Prewitt:

 

1

0

1

 

 

 

 

1

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0 1

 

 

 

0 0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0 1

 

 

 

1 1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sobel:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

0

1

 

 

 

1

2

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 0

2

 

 

0 0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0

1

 

 

 

1 2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Изотропный:

 

 

 

 

 

 

 

 

 

 

 

 

1 0

 

1

 

 

1

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

0

 

2

 

 

 

 

0

0

 

 

 

0

 

 

1

0

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Первый оператор представляет собой дифференцирование по х, второй — по y.

В результате для каждого пикселя изображения будет получено значение градиента и его направление. Пиксель будет отнесен к точке контура в том случае, когда его значение превышает некоторое пороговое значение:

1,

m, n Ig

m, n

 

0,

èí à÷å

Ig m, n ;

g m, n t

Как правило, порог составляет несколько (5…8) процентов от максимального значения градиента на всем изображении.

Компас-операторы

Компас-операторы определяют значения производных в нескольких (четырех) направлениях, значение градиента приравнивается максимальной из этих производных, а его направление – направлению этой производной.

Варианты компас-операторов:

 

1

0

1

 

 

 

1

1

0

 

 

 

 

 

 

 

 

 

1

0

1

 

 

1

0 1

 

 

 

 

 

 

 

 

 

 

 

1

0

1

 

 

 

0

1

1

 

 

 

 

 

 

 

 

 

 

 

 

1 1 1

 

0 1 1

 

 

 

 

 

 

 

 

 

 

 

0

0 0

 

1 0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

1

 

1

1

0

 

 

 

 

 

 

 

 

 

 

 

 

 

Варианты компас-операторов (только северного направления):

 

1

1

1

 

5

5

5

 

1

2

1

 

3 0

3

 

 

 

 

 

 

 

 

1

1

1

3

3

3

 

 

 

 

 

 

 

 

Операторы Лапласа для выделения контура

К сожалению, градиенты 1-го порядка работают хорошо лишь тогда, когда переход от одного уровня серого к другому достаточно крутой. Однако переходная зона может быть широкой и тогда более надежными становятся градиенты 2-го порядка.

В этом случае часто используется оператор Лапласа:

2 f 2 f 2 fx2 y2

Три варианта дискретной реализации оператора Лапласа:

 

0

1 0

 

 

1 1

1

 

1

2

1

 

 

 

 

 

 

 

 

 

 

 

1 4

1

1 8

1

2

4 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

0

 

1

1

1

 

1

 

2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Контурные точки – точки пересечения нуля или один из локальных экстремумов.

Производные 2-го порядка очень чувствительны к шуму. Кроме того, пороговое отсечение 2-й производной приводит к двойной линии контура.

Информация об угле направленности контурных линий может быть получена поиском точек пересечения нуля 2-ой производной вдоль произвольного направления.

2 f

 

f

x cos

f y

sin

 

 

 

r2

 

r

 

 

 

 

r

 

 

 

 

 

 

2

f

cos2

2

f

sin cos

2 f

sin2

 

x2

x y

y2

 

 

 

 

 

 

 

Операторы выделения одиночных линий

Эти операторы настроены на выделение участков границы, а также на соединение контурных точек в линию. Наиболее распространенный дискретный оператор выделения линий:

 

1

1

1

 

2

1

1

 

1

2

1

 

1

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 2

2

 

1 2

1

1 2

1

1 2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

1

1

1

2

 

1

2

1

 

2

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отслеживание контурных точек

Граница – замкнутая кривая, состоящая из контурных точек.

Граница объекта – важнейшая характеристика при анализе, необходимая для расчета различных геометрических признаков – таких как периметр, площадь и т.д. Алгоритм описания границы для бинарного изображения:

1)Начало – любая точка, принадлежащая контуру

2)Поворот налево + шаг (один пиксел)

3)Если новая точка находится внутри объекта – повтор п.2

4)Если новая точка находится вне объекта – поворот направо + шаг

5)Вернуться к пунктам 2,3

6)Продолжать до тех пор, пока очередная точка не совпадет с начальной

Алгоритмы соединения точек контура

в замкнутую линию

Результатом проведения операций по выделению контуров с помощью градиентных операторов (1-го или 2-го порядка) возможна ситуация, при которой границы представлены лишь отдельными участками, между которыми – пропуски. Задача состоит в воссоединении контурных точек в (замкнутую) границу. Результат компас-оператора выделения контурных точек — модуль градиента и угол, под которым возможно направление границы — перпендикулярное направлению возрастания градиента. Угол может принимать значение, кратное 45 .

Алгоритм соединения строится на оценке на каждом шаге величины целевой функции, которая в данном случае равна значению градиента в каждом из трех возможных направлений шага, то есть (+45 , 0 ,-45 ).

Более общий алгоритм для воссоединения контурных точек, удаленных друг от друга на значительное расстояние. В этом случае могут быть альтернативные варианты проведения границы.

Задача ставится как задача динамического программирования, в которой критерием выбора управляет целевая функция, оценивающая “эффект” от выбора того или иного пути соединения краевых точек

Функция цели в этом случае выглядит так

 

 

 

 

 

N

 

 

 

N

 

 

N

 

x1...xN , N

 

g xk

 

 

 

xk xk 1

 

d

xk , xk 1

 

 

 

 

 

 

 

 

k 1

 

 

 

k 2

 

 

k 2

 

Где

 

g xk

 

— модуль градиента в точке,

xk — угол, под которым направлена

 

 

граница в точке, d xk , xk 1 — величина шага от одной точке к другой.

 

 

Функция цели:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

N

N

 

x1...xN , N

 

 

 

g xk

 

 

 

xk xk 1

 

d xk , xk 1

 

 

 

 

 

 

 

 

 

 

k 1

 

k 2

k 2

 

Где , — весовые коэффициенты, имеющие смысл «платы» за изменение

направления границы и изменение шага (предпочтительным является путь по прямой

– причем по горизонтали или вертикали).

Представление (запись) границы объекта

Цепной код

Определяются восемь возможных векторов направления — от 000 до 111 (от 0 до 7). Тогда запись границы объекта будет содержать координату стартовой точки (пикселя) и далее – трехбитовые коды направления очередных шагов.

Например, граница задается кодом:

1001 1010 111 110 000 001 000 110 101 101 110 011 010 100 010 001

Задача — восстановить кривую.

Другой (обобщенный) вариант цепного кода – запись функции угла касательной к границе от длины.

Запись границы в виде отрезков прямых линий

Алгоритм:

1)соединить две наиболее удаленные точки контура

2)для каждой из «половинок» — если расстояние от точки (пикселя), наиболее удаленной от линии, соединяющей крайние точки, больше некоторого значения, то эта точка соединяется с каждым из концов, образуя два новых отрезка

3)далее операция повторяется для каждого из образованных отрезков до тех пор, пока не будет удовлетворен критерий аппроксимации криволинейного участка прямой линией

Описание границы с помощью В-сплайнов

В-сплайны представляют собой кусочно-полиномиальные функции, с помощью которых можно аппроксимировать контуры объектов на изображении, используя небольшое количество параметров.

Результат — сглаженная кривая.

Пусть t — переменная длины кривой, x t , y t — определяют координаты точки в

координатной плоскости.

Тогда для произвольной точки кривой справедлива запись:

n

z t pi Bik t

i 0

 

 

 

 

T

 

i

 

i1 i 2

 

z t x t , y t

,

p

 

p , p

T

 

 

 

Нормализованные В-сплайны k-го порядка могут быть сгенерированы с помощью рекурсивной формулы:

Bik

t

t ti Bik 1 t

 

 

ti k

t Bi 1k 1

t

, k 2, 3...

 

ti k 1 ti

 

 

ti k ti 1

 

 

 

 

 

 

 

 

 

Bi1

t

1,

t t t

i 1

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

èí à÷å

 

 

 

 

 

Параметр k контролирует порядок полинома на каждом участке (k=3 – квадратичный, k=4 – кубический полином).

Если узловые точки расположены эквидистантно, то есть ti 1 ti

t,

i , тогда

Bik t B0k t i ,

i k 1, k,..., n k 1

Для единичного шага вдоль кривой:

 

0

 

i k

ti

 

1

k i n

i k

 

 

2

i n

 

n k

Выражения для однородных В-сплайнов:

 

1,

0 t 1

 

 

t,

0 t 1

B01

B02

 

t,

1 t 2

t

èí à÷å

t 2

 

0,

 

 

0,

èí à÷å

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t3

 

 

0 t 1

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t2

 

 

 

 

 

 

 

 

 

 

 

0 t 1

 

3t3 12t 2 12t 4

 

 

 

 

 

 

,

 

 

 

,

1 t 2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 t 2

 

6

 

 

 

 

 

 

 

 

 

 

 

 

B t

t2 3t 1.5,

B t

 

 

 

 

 

3 t

 

 

3t3 24t 2 60t 44

, 2 t 3

03

2

 

04

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

,

2 t 3

 

 

6

 

 

 

 

 

 

 

 

 

4 t

3

 

 

 

 

 

 

 

 

 

 

 

 

0

 

èí à÷å

 

,

 

3 t 4

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

 

 

èí à÷å

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Контрольные точки служат не только коэффициентами разложения по В- сплайнам в приведенной формуле, но и определяют положение вершин многоугольника, аппроксимирующего гладкую границу объекта. Число контрольных точек для точного воспроизведения заданной границы обычно много меньше, чем число точек, которые определяют гладкую кривую. При этом может быть получено сжатие данных с коэффициентом компрессии порядка 10 — 100. Для того, чтобы переместить объект (с границей) в пространстве, масштабировать или повернуть на какой-либо угол, достаточно все эти операции проделать с контрольными точками.

Многие геометрические признаки объекта на изображении (центр масс, площадь, периметр) могут быть легко рассчитаны по контрольным точкам.

Одна из ключевых задач — определить минимальное количество контрольных точек, обеспечивающих В-сплайновое представление границы с заданной погрешностью.

Описание границ методом дескрипторов Фурье

Поскольку линия, представляющая границу какого-либо объекта, замкнута (ее значения будут повторяться с периодом, равным длине периметра границы), то она может быть записана в виде ряда Фурье

Если кривая представлена N точками u n x n jy n ,

n 0,1,..., N 1, то

дискретное преобразование Фурье будет иметь вид:

 

1

 

N 1

 

 

 

2 kn

 

u n

 

 

a k exp j

 

 

,

0 n N 1

 

 

 

 

 

N k 0

 

 

 

N

 

 

 

 

N 1

 

 

2 kn

 

 

 

 

 

 

 

a k u n exp

j

 

 

,

0 k N 1

 

 

 

n 0

 

 

 

 

N

 

 

Комплексные коэффициенты разложения или какая-нибудь их комбинация и называются дескрипторами Фурье. Наиболее типичные геометрические преобразования с исходным объектом на изображении приводят к соответствующим

операциям над дескрипторами Фурье.

Преобразование

Граница

 

Дескрипторы Фурье

 

 

 

 

Перемещение в плоскости

u n u n u

a k a k u0 k

 

 

0

 

 

 

Масштабирование

u n u n

 

a k a k

 

 

 

 

 

 

 

Замена начальной точки

u n u n n

 

 

2 n0k

 

0

 

a k a k exp j

 

 

 

 

 

 

 

 

 

 

 

 

 

N

Вращение

u n u n exp j 0

a k a k exp j 0

 

 

 

 

 

 

Из приведенной таблицы видно, что дескрипторы Фурье обладают инвариантными свойствами. Например, модули всех дескрипторов инвариантны к положению начальной точки, вращению. Отношение (комплексного) дескриптора к его модулю инвариантно к масштабированию.

Эти свойства могут быть использованы в обнаружении объектов одинаковой формы, независимо от их размеров и ориентации (поворота в плоскости).

Однако надо учитывать, что сами по себе амплитуда и фаза дескрипторов в отдельности не могут быть использованы для (взаимно-однозначного) описания границы.

Сопоставление (сравнение) объектов по их границам

Дескрипторы Фурье могут быть использованы для сравнения объектов похожей формы, даже если они имеют различные размеры и отличаются по ориентации в пространстве.

Если a k и è b k являются дескрипторами Фурье границ двух объектов на

изображении u n и v n ,то по форме они одинаковы (относятся к одному классу), если мала величина, рассчитываемая по формуле:

d u0 , , 0 , n0

min

N 1

 

u n v n n0 exp j 0

u0

 

2

 

 

 

 

 

 

 

u0 , , 0 ,n0

n 0

 

 

 

 

 

 

 

 

 

Описание области, занимаемой объектом, его структуры и формы

Представление области

1) Запись в виде кода следующего вида Пример: (2,1)2, (2,4)1, (3,0)5, (4,2)2, (4,5)1, (5,3)4, (6,1)2, (6,5)1, (7,0)2;

Где кодовая ячейка имеет вид: (КоординатаX, КоординатаY)Количество пикселей, принадлежащих объекту в строке.

2)Представление с помощью проекций (томография)

3)Представление в виде квадратичного дерева

Все изображение (квадратное) разбивается на 4-е части. Каждая из частей получает обозначение “g” (grey — серый), если в области содержатся и черные (black) и белые (white) пиксели; если же в области находятся только черные (белые) пиксели, то область получает обозначение “b” (“w”). Каждая из частей с обозначением “g” делится также на четыре части и т.д.

Пример (то же изображение, что в предыдущем случае): g(wwg(wwbb)w)g(g(wwbw)wg(bwww)g(bbbw)) g(g(bbwb)g(wwwb)g(bbbw)w)g(wg(wbbb)g(bbbw)w)

Описание структуры объекта

1) Скелетизация

Скелет — совокупность точек, равноотстоящих от (локальных) границ объекта (равны перпендикуляры, опущенные на границы по обе стороны от точки скелета).

Алгоритм скелетизации:

uk m, n u0 m, n

 

min

 

 

uk 1 i, j ; i, j :

m, n;i, j 1

 

 

 

 

 

 

 

 

 

m,n;i, j

 

 

 

 

 

 

u0 m, n u m, n ;

 

k 1, 2....

 

 

 

 

 

 

 

 

k

 

 

u

k

 

 

 

 

 

 

 

 

 

 

m, n

 

: u

 

m, n

 

 

 

i, j

 

,

 

 

m, n;i, j

 

1

 

Где m, n;i, j — расстояние между точками (m,n) и (i,j).

2) Запись в виде соединения примитивов — элементарных структурных фрагментов.

Описание формы объекта

1)Геометрические признаки

a)T x2 t y2 t dt — периметр

б)

S dxdy

y t

dx t

dt x t

dy t

dt — площадь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в) Rmin , Rmax — радиусы вписанной и описанной окружностей

г)

 

 

T 2

— компактность

 

 

 

 

 

 

 

 

 

4 S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 T

 

k t

 

2

 

 

k t

\

 

2

d 2 y 2

 

d 2 x 2

 

 

 

 

 

 

 

 

 

д)

E

 

 

 

 

 

 

dt,

 

 

 

 

 

 

 

 

 

 

 

 

— граничная (изгибная) энергия

T 0

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

dt

 

 

 

2) Признаки в виде моментов