Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Класс_Кт.doc
Скачиваний:
25
Добавлен:
08.12.2018
Размер:
2.29 Mб
Скачать

2.2. Признаки объекта

В общем случае задача распознавания образов сводится к разработке такой процедуры, которая выполняет разбиение множество объектов на классы, в предположении, что такое разбиение существует.

Считается, что в строгой постановке задача распознавания образов является в принципе неразрешимой. Действительно, для того, что бы определить, в строгом смысле этого слова, конкретный объект необходимо либо перечислить все то, что не является данным объектом, либо всю совокупность отличительных признаков, которые выделяют его из множества других объектов.

Известно, что в действительности, человек воспринимает и анализирует не сам объект, а лишь некоторую ограниченную совокупность его наиболее характерных признаков.

Множество выделенных свойств (существенных признаков) и сами свойства могут быть различными в зависимости от того, кто является получателем информации - человек или автоматическое устройство. Например, в понятие «самолет» человек вкладывает определенные признаки объекта. Это конструкция, состоящая из крыльев, фюзеляжа, реактивных двигателей и т.д. Для автоматического устройства – такими признаками могут быть определенные характеристики радиосигнала, который отражается от наблюдаемого объекта.

Так как число различных характеристик или свойств одного и того же объект, может быть неограниченным, то на практике выбирают некоторое ограниченное, характеристическое множество признаков, связанное с объектом. Их называют существенными признаками объектов.

Пусть - множество объектов, а - множество всех признаков этих объектов:

.

Если его можно разделить на такие непустые множества , что выполняется соотношение и , то называют классами, саму процедуру - разбиением на классы, а множество называют сепарабельным. Другими словами, совокупность представляет собою результат разделения множества на множество классов .

Разработка автоматических систем непосредственно связана с процедурой измерения выделенных характеристик объектов. Для определения значений признаков используются различные способы, приведем некоторые из них:

  • количественный: значение признака получено в результате измерения некоторой физической величины (длины, массы, температуры, электрического сопротивления и т. д.);

  • вероятностный: каждому элементу множества ставится в соответствие вероятность наблюдения некоторого признака;

  • двоичный: при наличии у объекта данного свойства или при его отсутствии.

Как правило, в задачах классификации используются не все признаки объекта, а лишь существенные, то есть те, которые являются определяющими для дальнейшей классификации объектов и разработки совокупности правил (решающих правил), руководствуясь которыми принимается решение - к какому классу следует отнести рассматриваемый или предъявляемый объект. Существенные признаки образуют подмножество (), которое содержит меньше элементов, чем множество .

Поскольку множество содержит все характеристики исследуемых объектов, то будем называть его множеством объектов. При этом множество , которое содержит только существенные признаки объектов, которые позволяют установить их сходство или различие, поэтому будем называть множеством образов выбранной совокупности объектов.

Рассмотрим обобщенную модель системы классификации. Она должна включать множество существенных признаков или образов , множество измерений существенных признаков и множество принятия решений . На рис. 2.1 схематически изображены эти три множества и связи между ними.

Прежде чем приступить к реализации системы классификации, необходимо из совокупности признаков объектов выделить подмножество существенных признаков.

Следующий шаг заключается в выборе процедуры измерения существенных признаков и соответствующей шкалы, в которой будут определяться их значения. Таким образом, множество измерений состоит из измерений существенных признаков объектов . Между множеством объектов и множеством измерений устанавливается взаимное соответствие , то есть объекту соответствует элемент .

Для того, что бы системы классификации функционировала необходимо установить совокупность правил, руководствуясь которыми множество можно разбить на классы. Совокупность этих решающих правил образует множество принятия решений .

Результаты измерений признаков объекта поступают в блок принятия решений, где выполняется их сравнение в соответствии с заданными критериями. Результатом сравнения является определение принадлежности предъявленного объекта к тому или иному классу.

Рассмотрим основные принципы распознавания образов на примере задачи классификации треугольников. Будем считать, что треугольник - это плоская фигура, у которой три угла. В общем случае, такие треугольники могут характеризоваться длинами и формой сторон, внутренними углами и т.д. Выберем в качестве существенных признаков градусную меру их внутренних углов:

,

где

Очевидно, что не исключены случаи, когда для классификации будут предъявляться «треугольники», у которых сумма углов не только равна 1800, но может быть меньше или больше 1800.

Будем отображать множество всех треугольников точками в трехмерном пространстве. Назовем его пространством образов или существенных признаков. Тогда множество таких треугольников в пространстве существенных признаков будет отображаться точками расположенными внутри куба (см. рис. 2.3).

Выделим в пространстве существенных признаков области, которые содержат треугольники, суммы углов которых равны, меньше и больше 1800. Функцию

будем использовать в качестве решающего правила, для разбиения множества треугольников на классы. С другой стороны функция - это отображение, которое реализует разбиение множества треугольников на классы. Уравнение определяет разделяющую плоскость (на рис. 2.3. эта плоскость выделена серым цветом). Таким образом, пространство существенных признаков разделяется на три области или три класса, а именно:

  • плоскость, содержит «правильные» треугольники;

  • область в кубе для которой - треугольники, у которых сумма углов меньше 1800;

  • область - треугольники, у которых сумма углов больше 1800.

В дальнейшем будем рассматривать только «правильные» треугольники. Измерив, углы у каждого треугольника, предъявляемого к классификации, получим множество , значений существенных признаков, элементы которого выражены в градусах, например:

На множестве «правильных» треугольников тоже выделим три класса (плоскость на рис. 2.4): . Точка , для которой выполняется условие - это класс равносторонних треугольников. Класс равнобедренных треугольников, отображается прямой . Остальная часть плоскости - это треугольники общего вида. В данном случае множество принятия решений состоит из трех решающих правил – это соотношения, которым должны удовлетворять значения существенных признаков объекта :

.

Отметим, что в этом примере наряду с классификацией треугольников одновременно произведена и их идентификация, которая, в простейшем случае заключается в приписывании наименований различным классам. В рассмотренном случае в принципе достаточно ограничиться лишь разделения множества объектов на классы или пространства признаков на отдельные области. Как правило, при разработке практически важных систем классификации не удается заранее определить не только области занимаемые классами в пространстве существенных признаков, но и количество самих классов. Кроме того, объекты, принадлежащие одному и тому же классу, не являются полностью идентичными. Поэтому необходимо определить критерии, в соответствии с которыми будет определяться сходство между объектами, между объектом и классом или между классами.