- •Лекция №4 Статистические дискриминантные функции
- •4.1 Введение
- •Здесь p(I) – априорная вероятность классаI иp(X/I) – функция правдоподобия классаI или условная плотность вероятностейx.
- •Тогда мы имеем
- •Предположим , что 1 – класс своего самолета и2 – класс вражеского самолета, тогда несомненоL12 l12 так какL12 это ложная тревога, аL21 соответствует опасности.
- •4.2.3. Решение по максимуму правдоподобия
- •4.2.5. Вероятность ошибок.
- •4.3.2 Оптимальные дискриминантные функции Из равенства (4.3.1) дискриминантную функцию можно записать в следующем виде:
- •Обучение статистической дискриминантной функции
Тогда мы имеем
L = (4.8)
Предположим , что 1 – класс своего самолета и2 – класс вражеского самолета, тогда несомненоL12 l12 так какL12 это ложная тревога, аL21 соответствует опасности.
Во многих случаях считается L12 = L12, что соответствует симметрической
функции потерь.
.2.2. Байесовская дискриминантная функция
По правилу Байеса мы можем написать
(4.9)
где , вероятность того , чтоx без указания класса, к которому он принадлежит. p(i)- априорная вероятность класса i , и
p(x/i)- функция правдоподобия класса i по отношению к x , то-есть плотность вероятности x при заданном состоянии природы i ( то-есть образа ,принадлежащему к классу i )
Подставляя (4.9) в (4.1) для rk(x), мы имеем
rk(x)= (4.10)
Так как в (4.10) является общим для всехrj(x), j= 1, ……., M, мы можем убрать его из уравнения среднего риска и искать только следующий минимум
(4.11)
для получения наилучшего решения среди возможных решений.
Альтернативно можно записать выражение для Байесовской дискриминантной функции :
dk(x) = - rk(x) (4.12).
Классификатор с такой минимизацией называется Байесовским классификатором, дающим оптимальные характеристики со статистической точки зрения .
4.2.3. Решение по максимуму правдоподобия
Как показано в разделе 4.2.2. , p(x/i) называется функцией правдоподобия для i . Выражение для средних или ожидаемых
потерь решения xk , будет иметь вид
.
Это выражение может быть использовано для минимизации для получения максимального правдоподобия для xk. . Для двухклассовой задачи средние или ожидаемые потери решения x1 будут иметь вид :
Аналогично потери решения x2 будут
В матричной форме
или
Решение относительно того что x1 будет принято , если
или
Неравенство может быть записано в другой форме :
x1 , если выполняется
(4.20)
Используя обозначение l12(x) для p(x/1)/ p(x/2) как
отношение правдоподобия и12 для
как пороговую величину , критерий для решения становится
(4.21)
Выражение 4.21. Может быть легко обобщено для многоклассовой проблемы (то-есть , когда M>2) . Обобщенное отношение правдоподобия и обобщенная пороговая величина будут соответственнно
И
Тогда критерий для решения имеет вид : принять
Это называется правилом максимального отношения правдоподобия .
Рассмотрим случай когда L является симметрической функцией потерь .
Тогда проблема сводится к принятию решения :
Правило максимального отношения правдоподобия для симметрической функции будет иметь вид :
Так как
Если p(i) = p(k) i, k правило максимального правдоподобия становится :
Принять :
Отметим, что различные функции потерь дают различные правила решения.
Теперь вернемся к более общему случаю когда p(i) p(k) и получим дискриминантную функцию для симметричной функции потерь . Так как мы имеем
Тогда
Другими словами , мы можем принятьxk , если выполняется
Дискриминантная функция при этом имеет вид
Альтернативная форма дискриминантной функции имеет вид
Расширяя это выражение до более общей формы, средние потери решения , что
xk будут :
или
Правило максимального правдоподобия тогда определится следующим образом
или
Суммарные члены в левой стороне (4.35) представляют собой средние потери решения xi , в то время как правая сторона представляет собой потери решения xj , j = 1,…..,M и j i.