Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ммпур методичка.DOC
Скачиваний:
126
Добавлен:
16.12.2018
Размер:
5.47 Mб
Скачать

Геометрическая интерпретация задачи распознавания.

Для более точной постановки задачи опознавания удобно использовать геометрические представления. Каждому объекту можно поставить в соответствие точку в многомерном пространстве. Геометрическая задача обучения опознаванию образов состоит в построении поверхности, которая в каком-либо смысле лучше всего разделяет многомерное пространство на области, соответствующие различным классам. Построение производится на основе показа некоторого числа образов, принадлежащих этим классам. Опознавание, которое производится после окончания процесса обучения, состоит в испытании нового объекта, о котором заранее неизвестно к какому образу он принадлежит. При этом объявляется название области пространства, к которой этот объект относится.

Первой части этой формулировки задачи опознавания (а именно обучению) можно поставить в соответствие «алгебраическую» формулировку. Обучение опознаванию состоит в «экстраполяции», т. е. в построении некоторой разделяющей функции по показам образов и указания, к какому классу эти образы принадлежат. Мы ограничимся двумя классами: 1 и 2 или A и B, т. е. случаем, который обычно называется дихотомией. К дихотомии можно последовательно свести и общий случай, когда число классов превышает два.

Обозначим разделяющую функцию через

,

где — -мерный вектор, характеризующий образ, а — величина, определяющая класс, к которому этот образ принадлежит.

Можно условиться, что разделяющая функция должна обладать следующим свойством:

т. е. знак определяет принадлежность к классу A или B. Наряду с детерминистской возможна и статистическая постановка задачи. В этом случае под подразумевается степень достоверности принадлежности к классу A, а — степень достоверности принадлежности образа к классу B. Из предыдущей формулы видно, что существует множество функций, определяющих разделяющую поверхность. Эти функции называются разделяющими. Очевидно, что такое множество существует по крайней мере тогда, когда классы легко различимы. Однако если это не так, то обычно существует лишь одна наилучшая разделяющая функция.

Таким образом обучение опознаванию состоит в построении некоторой разделяющей функции по показам образов и указания, к какому классу эти образы принадлежат.

Классификация задач распознавания.

Задачи опознавания можно разбить на типы, исходя из:

— вида представления информации;

— числа образов, подлежащих опознаванию;

— количества априорных сведений о свойствах опознаваемых образов.

По виду представления информации можно выделить два типа задач опознавания, которые условно называются «человеческими» задачами распознавания и «нечеловеческими».

Под «человеческими» подразумеваются такие задачи опознавания, к которым человек подготовлен в процессе эволюции и жизненного опыта и способен относительно сложные задачи решать сравнительно легко.

Задачи, которые способны решать на основе интуиции и опыта относительно небольшое количество людей, а большинство людей не подготовлено эволюцией и жизненным опытом к решению таких задач, относятся к «нечеловеческим».

К «человеческими» задачам относятся задачи опознавания зрительных и звуковых образов: задачи опознавания картинок, цифр, букв, речевых команд, голоса диктора и т.д.

В этих задачах опознавания человек, перерабатывая весьма большое количество информации, почти всегда способен сформулировать понятие образов, подлежащих опознаванию, по небольшому числу показов их реализаций.

С другой стороны, существует ряд задач переработки значительно меньшего количества информации, которые тем не менее для человека нетривиальны (“нечеловеческие” задачи). Чаще всего эти задачи связаны с обработкой ряда измерений (параметров), зависимость между которыми неизвестна и число которых достигает десятков и более. К таким задачам относятся задачи технической и медицинской диагностики. некоторые задачи прогнозирования и ряд других. Удовлетворительное решение этих задач требует от человека весьма высокой квалификации в этой области.

При делении задач по числу образов можно выделить три типа задач: задачи опознавания двух образов, задачи опознавания большего числа образов и задачи опознавания нескольких образов из неограниченного числа образов.

Обычно первые два типа задач принято рассматривать как один, так как формально задачу второго типа можно разбить на совокупность задач дихотомии. Однако прямое решение задачи разделения многих образов может оказаться значительно целесообразнее.

К третьему типу задач опознавания относятся, например, задачи опознавания неограниченного круга лиц по их портретам. В этих задачах необходимо отличать изображения заданного круга людей и выделить изображение каждого из них из неограниченного числа портретов других людей, которых автомат должен отнести к классу «не знаю».

Задачи опознавания можно также разделить по количеству априорных сведений о свойствах опознаваемых образов на вырожденные и невырожденные.

Начнем с вырожденного случая, когда имеются априорные сведения о том, что для каждого образа существует идеальный эталон, а различие между испытуемой реализацией и эталоном обуславливается стационарными случайными помехами с априорно известными распределениям. К таким задачам относятся, например, опознавание знаков типографской или машинной печати. Такие вырожденные задачи опознавания легко сводятся к задачам приема сигнала на фоне случайных шумов, задаче, достаточно хорошо исследованной и имеющей оптимальные методы решения.

К другому вырожденному случаю относятся задачи опознания, в которых все члены каждого класса могут быть получены один из другого детерминированным, наперед заданным преобразованием. Например, изображения отдельных букв, предъявляемых в различных параллельных проекциях.

К вырожденным задачам опознавания могут быть отнесены и некоторые задачи, в которых априори известны типа (многомерных) вероятностных распределений образов и каждый образ представлен выборкой своих реализаций. Наиболее адекватным математическим аппаратом для решения таких задач является теория статистических решений.

В подавляющем большинстве практические задачи опознавания являются невырожденными, и как правило, типы условных многомерных распределений образов неизвестны.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]