- •Стохастические, линвистические методы распознавания образов иерархическая группировка
- •Содержание:
- •Распознавание самолетов
- •Вероятностный подход Введение
- •Применение
- •Байесовская процедура распознавания
- •Лабораторная работа № 6. Байесовская процедура распознавания, обеспечивающая минимальную вероятность ошибки классификации
- •Цель работы
- •Теоретические сведения
- •Задание
- •4. Порядок выполнения работы
- •5. Литература
- •Лабораторная работа №7. Байесовский классификатор в случае образов, характеризующихся нормальным распределением
- •Цель работы
- •Теоретические сведения
- •Задание
- •Порядок выполнения работы
- •5. Литература
- •Контрольные вопросы
- •Иерархическая группировка Введение
- •Определение иерархии
- •Построение иерархии
- •Пример построения иерархической группировки
- •Лабораторная работа № 8. Иерархическая группировка
- •Цель работы
- •Задание
- •Применение
- •Общее представление
- •Задание 1
- •4. Задание 2
- •5. Порядок выполнения работы
- •Литература
- •Контрольные вопросы
Вероятностный подход Введение
Статистический подход к распознаванию образов можно использовать в тех случаях, когда имеющихся сведений недостаточно для описания образов или классов, которые, возможно, содержатся в рассматриваемом наборе данных. В таких обстоятельствах выходом из положения может оказаться применение статистических методов для анализа, что позволяет использовать всю имеющуюся априорную информацию.
Этот подход предусматривает построение классификации, исходя из статистических свойств классов объектов.
При помощи статистического анализа представляется возможным построить классификационное правило, являющееся оптимальным в том смысле, что его использование обеспечивает в среднем наименьшую вероятность совершения ошибки классификации.
Применение
При геохимических исследованиях измеряется концентрация химических элементов или соединений в образцах вещества для того, чтобы идентифицировать эти образцы или установить их происхождение. При решении таких задач применение статистических методов распознавания может оказаться, в частности, полезным в тех случаях, когда неизвестны физические причины возникновения обнаруженных концентраций определенных элементов или соединений.
Метеорология отличается колоссальным количеством накопленных данных и отсутствием в настоящее время возможности определить физическую сущность связей между всеми этими данными. Поэтому здесь могут найти применение статистические методы.
Алгоритмы распознавания на основе критериев Байеса можно применить к задаче технической диагностики редукторов.
Медицинская диагностика часто сводится к дифференциальному диагнозу, т.е. к выбору одного их нескольких заболеваний, причем при таком выборе учитывается и возможность наличия нормы (отсутствие какого-либо заболевания). Диагностические тесты (результаты опроса пациента, клинические данные, история болезни) образуют исходные данные для диагностики, из которых (при автоматическом распознавании) формируется для каждого обследуемого некоторый вектор симптомов. Затем следует сформировать обучающее множество, включающее описания больных, действительно страдающих соответствующими заболеваниями, и описания людей, у которых этих заболеваний нет; кроме того, для обеих групп должны быть заданы априорные вероятности. Теперь все методы из арсенала статистического распознавания можно применить для классификации нового пациента, т.е. для отнесения его к одному из классов заболеваний или классу норм.
Байесовская процедура распознавания
Рассмотрим стохастический подход к распознаванию образов, основанный на байесовской теории решений.
Пусть ={1,…, m} – конечное множество m состояний природы, D={d1,…, dp} – конечное множество p возможных решений (действий), L(di,j) – потери от принятия решения di при реализации состояния природы j.
Будем считать, что вектор признаков x=(x1,…, xn) данного классифицируемого объекта представляет реализацию системы случайных величин (случайного вектора) Х=(Х1,…, Хn), которая для состояния природы j характеризуется:
плотностью вероятности p(x/j), если Х – система абсолютно непрерывных случайных величин (СВ);
законом распределения (выбором вероятностей) P(x/j)= P(X=x/j), если Х – система дискретных СВ.
Пусть Р(j) вероятность появления состояния природы j и пусть P(j/х) – условная вероятность появления состояния природы j при условии, что будет наблюдаться значение случайного вектора Х=х. Используя формулу Байеса, имеем:
если Х – система абсолютно
непрерывных СВ
если Х – система дискретных
СВ
г
Условное математическое ожидание потерь от выбора действия di при появлении значения Х=х есть
эта величина называется условным риском.
Введем в рассмотрение функцию d(x), которая ставит в соответствие каждому возможному значению х случайного вектора Х некоторое решение di D; функция d(x) называется решающим правилом.
Условное математическое ожидание потерь при использовании решающего правила d(x) и при условии появления значения Х=х есть
Безусловное математическое ожидание потерь при использовании решающего правила d(x) есть
если Х – система абсолютно
непрерывных СВ;
если Х – система
дискретных СВ.
Величина R(d) называется общим риском.
Поставим следующую задачу: найти решающее правило d(x) такое, которое доставляет минимум функционалу R(d). Эта задача решается очень просто. Так как R(d) будем минимально, если d(x) выбрано так, что R(d(х)/х) имеет минимальное значение для каждого возможного х, то оптимальное решающее правило можно описать следующим образом:
Для данного х вычислить R(di / x) для i=1,…,p и выбрать то di, при котором R(di / x) минимально, т.е.
Такое решающее правило называется байесовским решающим правилом, а соответствующее минимальное значение общего риска R(dopt)– байесовским риском.
Задачу распознавания образов мы получим, если в приведенной постановке задачи выбора оптимального (байесовского) решающего правила установим между элементами множеств и D взаимно однозначное соответствие; таким образом, решение di заключается в отнесении объекта, имеющего изображение x, к классу i (ясно, что в этом случае p=m).
