Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Luciv / МКОИ_пособие

.pdf
Скачиваний:
51
Добавлен:
21.03.2016
Размер:
5.37 Mб
Скачать

Пороговое значение соответствует значению, при котором достигается максимум межкластерной дисперсии:

f *

= arg

 

max(σ2

( f

T

)).

 

 

 

 

 

 

 

 

(2.58)

T

1fT < L

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из (2.56):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

= q

(f

T

)[µ (f

T

)− µ]2 + q

2

(f

T

)[µ

2

(f

T

)− µ]2

=

B

1

 

 

1

 

 

 

 

 

 

 

 

 

(2.59)

 

 

 

 

 

 

(f

 

)q2

(f

 

)[µ1(f

 

)− µ2 ( fT )]2.

 

 

 

 

 

q1

T

T

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В соответствии с (2.59) алгоритм строится следующим образом. Для

каждого

 

возможного

значения

порога fT выполняются следующие

операции:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Все элементы изображения делятся по пороговому значению на два кластера.

Вычисляются средние значения кластеров.

Вычисляется квадрат разности математических ожиданий

Квадрат разности умножается на вероятности кластеров в соответствии с

(2.59).

Этот алгоритм реализуется как итерационная процедура. Прежде всего

выполняется инициализация алгоритма: q1(1) = p(1), µ1(1) = 1.

Затем для каждого возможного порога вычисляются:

 

q1( fT + 1) = q1( fT ) + p( fT + 1),

(2.60)

µ1( fT + 1) = [q1( fT )µ1( fT ) + ( fT + 1)p( fT + 1)] q1( fT + 1),

 

µ2 ( fT + 1) = [µ − q1( fT + 1)µ1( fT + 1)] [1 q1( fT + 1)].

(2.61)

На рис.2.10 приведен пример квантования изображения на два уровня, при автоматическом определении порога по методу Оцу.

Видно, что гистограмма исходного изображения является двухмодальной, однако область минимума занимает значительный диапазон значений яркости. Автоматически полученное значение порогового значения равно 142 и показано на изображении гистограммы визиром.

2.3.3Методы порогового ограничения, основанные на энтропии

Эти методы основаны на предположении, что изображения объекта и фона принадлежат разным источникам сигнала. В этом случае пороговое значение определяется тем значением яркости, при котором сумма энтропий двух классов объектов достигает максимального значения.

Энтропия фона определяется в соответствии с уравнением:

fT

H 0 ( fT ) = − p( f )log( p( f )),

f =0

где p( f )- плотность распределения яркости изображения. Энтропия объекта

71

L

H1( fT ) = − p( f )log( p( f )),

f = fT +1

где L – максимальное возможное значение яркости изображения.

fT = arg max (H 0 + H1 ).

f [0, L]

а) б) в)

Рисунок 2.10 а) Исходное изображение; б) бинарное изображение, полученное по автоматическому пороговому значению; в) гистограмма исходного изображения.

2.3.4Методы порогового ограничения, основанные на подобии признаков

Методы порогового ограничения, основанные на подобии признаков, вычисляют пороговое значение по некоторому критерию подобия полутонового изображения и полученного по нему бинарного изображения. В качестве атрибутов рассматриваются контуры, моменты распределения яркости и др.

72

Метод порогового ограничения по подобию моментов распределения основан на предположении, что полутоновое изображение можно рассматривать как бинарное изображение, подвергнутое НЧ фильтрации (расфокусировке). При таком подходе пороговое значение соответствует тому значению яркости, при котором первые три момента полутонового и бинарного изображения совпадают.

Другой метод основан на подобии изображений контуров полутонового и бинарного изображения. Пороговое значение устанавливается равным тому значению яркости, при котором достигается максимальное совпадение контуров бинарного и полутонового изображений, как показано на рис. 2.11.

Пороговое значение устанавливается в соответствии с уравнением:

fT = arg max [Egray Ebin ( f )]. f [0, L]

Выводы

Методы пороговой обработки предназначены для автоматической бинаризации изображения.

В случае, когда известны ожидаемые размеры объекта интереса, пороговое значение может быть задано как квантиль справа по гистограмме изображения.

Метод анализа мод гистограмм распределения позволяет выполнить бинаризацию в том случае, когда объект и фон представлены модами в гистограмме яркости изображения.

Методы кластеризации строятся по критерию минимума внутрикластерной дисперсии, или максимума межкластерной дисперсии. Переход от первого критерия ко второму позволяет повысить быстродействие алгоритма кластеризации.

Вычисление порогового значения по критерию максимума суммы энтропии изображения объекта и изображения фона основано на предположении, что изображения объекта и фона принадлежат разным источникам сигнала.

Вычисление порогового значения по критерию максимума совпадения признаков, полученных по полутоновому изображению и бинарному изображению, основано на предположении, что полутоновое изображение является расфокусированной версией бинарного изображения.

2.4Методы многопороговой обработки

Методы многопороговой обработки предполагают наличие в изображении объектов, принадлежащих числу классов, большему 2.

2.4.1Метод оценки мод гистограмм распределения яркости изображения

Метод основан на оценке мод гистограммы распределения яркости изображения. Для определения пороговых значений необходимо выполнить следующие действия:

73

найти соседние локальные максимумы в гистограмме pi,

рассчитать меру «пиковости» для локальных максимумов pi;

исключить максимумы, имеющие значение «пиковости» меньшее порога fT (Hp< fT );

установить значения порогов, для чего определить значения локальных минимумов min(p) , расположенных между значениями оставшихся локальных максимумов.

а) б) в) г)

Рисунок 2.11 Пороговое ограничение по методу подобия контуров изображений. а) Исходное полутоновое изображение; б) изображение контуров полутонового изображения Egray ; в) бинарное изображение; г) изображение контуров бинарного

изображения Ebin .

На рис. 2.12 приведен пример гистограммы распределения яркости изображения, содержащего 3 класса объектов. Оценка пиковости гистограммы производится в соответствии с уравнением:

 

 

 

p

л

+ p

п

 

 

N

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

H p = 1

 

2 pmax

1

 

 

 

 

 

 

 

Wpmax

 

 

 

f п

 

 

 

 

 

 

 

 

где N =

 

p( f ).

 

 

 

 

 

f= f л

Вкачестве предварительной обработки производится НЧ фильтрация гистограммы распределения яркости [21]. На рис. 2.13 показан результат такой обработки при использовании аппроксимирующего фильтра Добеши 4 [22].

74

В случае неизвестного числа классов объектов применяется метод стабильности моды.

W

pmax

pл

pп

f л fп

Рисунок 2.12 Метод оценки мод гистограмм распределения яркости изображений

2.4.2Метод стабильности моды

Метод позволяет оценить число мод гистограммы распределения яркости [21]. Для этого производятся следующие операции.

1Оценка гистограммы яркости изображения.

2 Оценка первой производной и подсчет длин положительных и отрицательных участков.

3Определение числа мод при выполнении условия для i-той моды

dH +i dH i < TH .

Далее в цикле:

4 Низкочастотная фильтрация гистограммы.

5Шаги 2, 3.

Шаги 4-5 повторять пока число мод на k-той итерации не будет равно числу мод на (k-1)-ой итерации.

2.4.3Метод Оцу для случая многопороговой обработки

Метод Оцу для случая многопороговой обработки [23]. Пусть мы выполняем сегментацию на М кластеров. В этом случае мы должны получить оценки (M-1) порогового значения.

Оптимальные значения порогов должны удовлетворять условию:

{f *, f *,..., f *

}=

arg

max{σ2

{f , f

2

,..., f

M 1

}}

(2.62)

1 2

M 1

 

 

B

1

 

 

 

1f1 < f 2 <...< f M 1 < L

Независимо от числа кластеров, рассматриваемых в процессе пороговой обработки, сумма накопленных функций вероятности М классов равняется 1, и среднее значение изображения равно сумме средних М классов, взвешенных с их накопленными вероятностями, то есть:

75

M

 

qk = 1

(2.63)

k =1

 

M

 

µ = qk µk

(2.64)

k =1

а)

б)

Рисунок 2.13 НЧ фильтрация гистограммы яркости изображения. а) Исходное изображение гистограммы; б) результат НЧ фильтрации при числе итераций, равном 5.

Аналогично (2.56) дисперсия межкластерных отклонений равна:

 

M

 

(µ

 

− µ)2

 

σ2

= q

k

k

(2.65)

B

k =1

 

 

 

 

 

 

 

 

 

 

 

 

Используя уравнения (2.63) и (2.64), межкластерная дисперсия (2.65)

может быть записана как:

 

 

M

 

 

 

2

 

 

σ2

= q

k

µ

 

− µ2

(2.66)

B

 

 

k

 

 

k =1

76

Поскольку не зависит от выбора порогов, то для выполнения критерия

(2.62) вместо σ2 достаточно анализировать только σ2 :

 

 

 

 

 

 

 

B

 

 

 

b

 

 

 

M

 

 

 

2 .

 

 

 

 

 

 

 

 

 

 

 

σ2

= q

k

µ

 

 

 

 

 

 

 

 

 

 

(2.67)

b

k =1

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Согласно критерию, чтобы найти оптимальные пороги, диапазон поиска

для максимальной σ2 составляет 1 ≤

f

<L-M+1, f + 1 ≤ f

2

<L-M+2, …, и

 

 

 

 

 

 

b

1

1

 

f M 1 + 1≤

f M 1<(L-1). На рис. 2.13

показаны зоны поиска порогов в

диапазоне значений сегментируемого изображения.

 

 

 

 

 

 

 

 

fM 1

 

 

 

 

L-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

L-(M-1)+2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f1

 

 

 

f2

 

 

 

 

 

 

L-(M-1)+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L-(M-1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

2 3

L-1

1

f1

f2

fM 1 L

Рисунок 2.13 Соотношение порогов в методе полного перебора.

Каждое следующее значение порогового значения должно быть хотя бы на 1 больше предыдущего. Это условие формирует левую границу диапазона. После каждого i-го порога должно быть установлено L-M+i следующих пороговых значений. Это условие определяет правую границу возможного диапазона порога.

Оптимальный выбор порогов производится методом полного перебора. Приведем пример оценки порогов по методу Оцу для случая трех классов. Исходное изображение получим синтезом 3 классов с постоянными

уровнями яркости 80, 160 и 240 соответственно.

Наложим на это изображение реализацию шума, распределенного по нормальному закону с СКО равным 30. Исходное и полученное изображения представлены на рис. 2.14.

На рис. 2.15 представлена гистограмма полученного изображения. Из рисунка видно, что метод оценки мод гистограммы распределения яркости в этом случае не может быть использован, поскольку гистограмма не имеет трех выраженных мод плотности распределения.

На этом же рисунке отображены пороговые значения, полученные по методу Оцу. Пороговые значения равны 97 и 170.

Сегментация на много (>2) кластеров по методу К-внутригрупповых средних рассмотрена в курсе [1].

77

а) б)

Рисунок 2.14 Изображение содержит три класса объектов.

Рисунок 2.15 Гистограмма распределения яркости изображения

2.4.4 Метод нечеткой кластеризации

При выполнении сегментации на много классов, приходится решать задачу отнесения объекта к тому или иному классу в условиях, когда различие между классами размыты, то есть когда можно скорее ответить на вопрос, в какой степени тот или иной объект принадлежит рассматриваемому классу. Задача нечеткой кластеризации состоит в нахождении нечеткого разбиения элементов исследуемой совокупности элементов на нечеткие кластеры и формирование соответствующих им значений функций принадлежности из диапазона [0,1].

Пусть совокупность исходных данных представляет собой конечное множество элементовA = {a1,a 2 ,...,an }, составляющих множество объектов кластеризации, где n – количество объектов кластеризации. Каждый объект характеризуется q -мерным вектором признаков: P = {p1, p2 ,..., p q }. Пусть

каждый компонент вектора признаков имеет оценку в виде действительного числа, формируя q -мерный вектор значения признаков:

78

x

i

= {xi

, xi

,..., xi

}, i [1, n].

 

1

2

q

 

Из векторов значения признаков можно сформировать матрицу данных:

x1

x1

...

x1

 

 

1

2

 

q

 

x12

x22

...

xq2

 

D =

... ... ... ...

.

 

 

 

xn

 

xn

xn

...

 

 

1

2

 

q

 

Задача нечеткого кластерного анализа формулируется таким образом: на основе исходных данных D определить такое нечеткое разбиение множества A на заданное число нечетких кластеров, которое доставляет экстремум некоторой целевой функции среди всех нечетких разбиений.

Метод нечеткой кластеризации рассмотрим на примере метода нечетких K- средних [24] для случая разбиения на k кластеров. В этом случае на функции принадлежности накладывается условие:

k

 

µ Aj (ai ) = 1, ai A ,

(2.68)

j =1

 

где k Ν , и k>1.

На функции принадлежности накладываются дополнительные условия отсутствия пустых кластеров:

n

 

(a ) > 0, j [1, k ]

 

µ

A j

(2.69)

i =1

i

 

 

 

 

и выполнения условия функции принадлежности:

µ A j (ai ) 0,

j [1, k ],

ai A .

(2.70)

Для каждого

 

кластера

вводится q -мерный

вектор центра кластеров

н

j

= [ν j , ν j ,..., ν j ],

j {1,..., k} каждый компонент которого определяется в

 

1

2

 

 

q

 

 

 

 

соответствии с уравнением:

 

 

 

 

n [µ

Aj

(a

 

)]m xi

 

 

ν j

 

i =1

i

 

l

 

 

=

 

 

 

 

 

для j {1,..., k}, p P ,

(2.71)

 

 

 

 

 

 

l

 

n [µ Aj (ai )]m

 

 

l

 

 

 

 

 

 

 

 

i =1

где m – экспоненциальный вес, равный некоторому действительному значению >1.

Целевая функция – сумма квадратов взвешенных отклонений координат объектов кластеризации от центров искомых нечетких кластеров:

ε(A

j

, ν j )= n

k

[µ

Aj

(a

)]m q (xi − ν j )2 .

(2.72)

 

l

 

 

i

l l

 

 

 

i =1j =1

 

 

 

l =1

 

79

Задача нечеткой кластеризации - найти матрицу U значений функции принадлежности объектов кластеризации нечетким кластерам, обеспечивающую получение минимума целевой функции.

Алгоритм нечетких k-средних выполняется в соответствии со следующей последовательностью действий.

1Задать исходные данные:

число искомых нечетких кластеров k;

максимальное число итераций алгоритма;

параметр сходимости алгоритма;

экспоненциальный вес нечеткой кластеризации m;

матрица данных D;

исходное нечеткое разбиение. 2 Итерация it =1:

рассчитать центры нечетких кластеров (2.71);

вычислить значение целевой функции (2.72). 3 Итерация it= it +1

сформировать новое нечеткое разбиение на k непустых нечетких кластеров;

рассчитать новые функции принадлежности для s {1,..., k}, ai A :

 

 

 

 

 

 

 

2

 

1

 

 

 

q

 

 

 

 

 

m 1

 

 

 

 

 

(xi − ν s )2

 

 

 

 

 

k

 

l =1

l

 

 

 

 

 

 

 

 

 

l

 

 

 

 

 

 

 

µ'As

(ai ) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 2

 

 

j =1

q

 

 

 

 

 

 

 

(xi − ν

l

)

 

 

 

 

 

 

l

 

 

 

 

 

 

l =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитать центры нечетких кластеров (2.71);

Вычислить значение целевой функции (2.72).

Сравнить значения целевой функции на двух последовательных

итерациях.

4Проверить выполнение условия останова:

ε(A j ,νlj )− ε′(A j , νlj ) dε ,

где dε - параметр сходимости алгоритма

или число итераций превосходит заданное максимальное число итераций.

Если условие не выполнено, перейти к шагу 3, увеличив счетчик числа итераций it=it+1.

5 Представить результаты нечеткой кластеризации в форме обычного не нечеткого разбиения (выполнить дефаззификацию). Поскольку функции принадлежности вычисляются в соответствии с (2.68), то каждый объект

80