Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Системы искусственного интеллекта

Файл:

Распознавание образов / Lection_RECOGNITION / LECTURE4 / Lecture4_all.DOC

Скачиваний:

Добавлен:

01.05.2014

Размер:

850.43 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

4.2.5. Вероятность ошибок.

Рассмотрим для начала классификатор на два класса . Этот классификатор будет делить пространство на две области R₁и R₂ . Решение x₁будет принято , когда образ x попадает в область R₁; и x₂ когда x попадает в область R₂. При этих предположениях будут возможны два типа ошибок :

x попадает в область R_1
,но в действительности x_2
.Это дает вероятность ошибки E₁ , которая может быть обозначена как Prob (x R₁, ₂).
x попадает в область R_2
,но в действительности x_1
.Это дает вероятность ошибки E₂ , которая может быть обозначена как

Prob (x R₂, ₁). Тогда общая вероятность ошибки будет

Это информационный критерий который необходимо минимизировать , чтобы получить хорошую классификацию. На рис. 4.1 показаны области принятия решения и области ошибок ( заштрихованы)

Рис. 4.1. Вероятности ошибок в двухклассовой задаче.

Площадь заштрихованных областей определяет суммарную ошибку классификации . Видно что ошибка E₂ для произвольной решащей границы состоит из двух частей ( с левой штриховкой и поперечной). Если мы будем двигать произвольную границу к оптимальному положения область с поперечной штриховкой будет уменьшаться до нуля . Оптимальная решающая граница будет иметь место , когда x удовлетворяет следующему уравнению

d₁(x) = d₂(x) (4.51)

или

Для получения аналитического выражения для ошибки предположим , что мы вектора образов описываются многомерными нормальными распределениями с различными математическими ожиданиями и одинаковыми матрицами ковариаций C₁ = C₂ = C :

Тогда согласно (4.20) и (4.21)

или

Аналогично :

Подставляя выражения для нормальных плотностей вероятностей (4.53), (4.54)

получаем

Беря логарифм от этого выражения и обозначая его p₁₂ имеем :

Тогда

Ожидаемая величина p₁₂ для класса 1 определяется как

Дисперсия p₁₂ для класса 1 определяется как

и будет равна

Так как по определению

Далее имеем

Подставляя обратно в (4.63) , получаем

E₁[p₁₂] = , (4.67)

Где r₁₂ равно расстоянию Махаланобиса между p(x/₁) и p(x/₂).

Тогда для x₁отношение

распределено с математическим ожиданием и дисперсией r_12,

в то время как x₂ математическое ожидание равно - , и дисперсия

имеет то же значение r₁₂. Поэтму вероятность неправильной классификации когда x₂ будет равна

и вероятность неправильной классификации x₁ будет

Общая вероятность ошибки P_error ,будет

Этот анализ может быть легко распространен на случай многоклассовой задачи.

Здесь больше случаев получения ошибочных решений, чем правильных. Поэтому проще вычислить вероятность правильного решения .

Выражение для вероятности правильной классификации имеет вид :

где означает вероятность того , чтоx попадает в R_i , в то время как правильное состояние природы таково , что x_i. Суммируя

i = 1,2, ……M получаем общую вероятность правильной классификации . Соответственно общая вероятность ошибочной классификации будет имет вид

P_error = 1 – P_correct

. Оптимальные дискриминантные функции для нормально распределенных образов.

4.3.1. Нормальное распределение.

Многомерное нормальное распределение представляется следующим образом :

где N- функция нормальной плотности вероятностей, m_k– вектор математического ожидания и C_k– ковариационная матрица для класса k,

определяемые как математическое ожидание по классу k

Образы из нормальной популяции в пространстве признаков принадлежат одному кластеру , центр которого определяется вектором математического ожидания ,а форма – матрицей ковариации. На рис .4.2. показаны три различных кластера с различной формой. В части (а) m = 0 и C = I (единичная матрица), Cij = Cji = 0 , Cii = 0. Для кластера в части (b),

C₂₂> C₁₁ и для кластера в (с)

Главные оси гиперэллипсоидов (контуров равной плотности вероятностей)

Определяются собственными векторами C с собственными числами , определяющими относительную длину этих осей.

Полезная мера подобия , известная как Махаланобисово расстояние от образа

x до среднего m, определяется следующим образом :

Расстояние Махаланобиса между двумя классами определяется как :

Напомним, что для n = 1 , приблизительно 95% выборочных значений x попадает в область x - m< 2, где  - стандартное отклонение и равно С^1/2.

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

Соседние файлы в папке LECTURE4

#
01.05.2014519.17 Кб73DISCRAN.DOC
#
01.05.2014850.43 Кб66Lecture4_all.DOC
#
01.05.201438 б59readme