Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Класс_Кт.doc
Скачиваний:
25
Добавлен:
08.12.2018
Размер:
2.29 Mб
Скачать

2.4.1. Понятие об обучении. Обучение с учителем и без учителя.

В процессе распознавания образов одной из основных задач является задача классификации, т.е. разделения множества исходных данных на классы - непересекающиеся подмножества. Принципы такого разделения не всегда могут быть формализованы, и достаточно строго определять процедуру разбиения. Пусть задано пространство существенных признаков, которое соответствует поставленной задаче.

Первый этап решения состоит в том, чтобы отобразить в этом пространстве совокупности точек (или единственную точку), связанных с одним и тем же классом, а затем выбрать один или несколько объектов в качестве экземпляров, представляющих будущие классы. На следующих этапах они будут использоваться для распознавания неизвестного образа, исходные данные, о котором получены таким же методом, как и данные об уже известных объектах.

В основу такого способа классификации положен процесс обучения, в задачу которого входит постепенное усовершенствование критериев разделения предъявляемых объектов на классы. Этот процесс должен быть, по возможности, автоматизированным. Для этого из некоторой совокупности объектов (обучающей выборки) часть объектов выбирают в качестве представителей или экземпляров классов. Затем их используют, в процессе обучения для «тренировки» системы.

Если совокупность классов известна заранее, то есть известно или количество классов, или экземпляры этих классов, то обучение называют контролируемым - «обучение с учителем». В этом случае, в ходе обучения системы количество классов не изменяется, уточняются только критерии распределения объектов по классам.

Если классы, составляющие обучающую выборку, не известны заранее, то обучение называют неконтролируемым, или «обучением без учителя». При «обучении без учителя» система распознавания должна самостоятельно уточнить критерии разделения объектов на классы и экземпляры этих классов.

Эффективность «обучение» системы распознавания, как в первом так и во втором случаях, во многом зависит от как подобрана обучающая выборка. Желательно сформировать ее так, чтобы объекты достаточно хорошо разделялись на классы.

2.4.2. Общая схема системы классификации

Н а рис. 2.12. приведена структурная схема системы автоматической классификации. Блок 1 преобразует физическую величину, поступающую с внешней среды (датчики, абоненты информационной системы и т.д.) на его вход, в сигнал, предназначенный для блока 2 предварительной обработки (обычно выходными сигналами блока 1 являются электрические сигналы). Это дает возможность использовать на входе датчики различных типов. Для цифровых систем используют либо датчики с цифровым выходом, либо после аналогового датчика включают аналого-цифровой преобразователь. Технические варианты решения этого узла системы могут быть выполнены по-разному.

В блоке предварительной обработки осуществляется выделение характерных признаков объекта или их семейства. При выделении существенных признаков, прежде всего, необходимо выделить ту часть сигнала, в которой содержатся все признаки предъявляемого объекта. Для этого необходимо аппаратными или программными средствами устранить случайные искажения и сгладить шумы, сопровождающие входную информацию, которая поступает в различные моменты времени или в различных условиях эксплуатации.

Более подробно все методы обработки сигналов излагаются в теории связи. Рассмотрим только описательную характеристику этих методов.

Для того чтобы представить сигнал в виде вектора, используются преобразование Фурье или другие известные преобразования. В ходе такого преобразования, как правило, осуществляется фильтрация сигнала, т. е. выделение полезного сигнала и подавление шума. В процессе фильтрации в спектре входного сигнала выделяются отдельные частоты или полосы частот, несущие существенную информацию о предъявляемом объекте. Эти спектральные составляющие отражают характерные признаки данного объекта и, по сути, являются составляющими вектора существенных признаков.

Для того чтобы составить представление о трудностях связанных с выделением полезного сигнала, рассмотрим простую задачу. К чему следует отнести флуктуации длительности паузы, разделяющей слова при передаче речи - к сигналу или к шуму? Если учитывать контекст, то это, вероятно, сигнал, так как в нем содержится информация о самом факте разделения слов. В противном случае паузу следует рассматривать как шум. Процесс выделения существенных признаков можно считать одной из разновидностей задач фильтрации. Такой подход основан на предположении, что все характерные признаки можно рассматривать как составляющие спектра сигнала, порождаемого распознаваемым объектом.

Таким образом, в результате обработки сигналов, на выходе блока предварительной обработки получают существенные признаки объекта, которые поступают в блок классификации. Если существенные признаки образуют метрическое пространство, то каждый предъявляемый объект отображается точкой в этом пространстве. При этом необходимо учитывать, что результаты измерений содержат погрешности различной природы (случайные или систематические ошибки измерений). Всё это приводит к тому, что одно и то же семейство предъявляемых объектов в действительности представляется «облаком» точек, заполняющим некоторую область в пространстве образов. В ходе предъявления новых объектов, система классификации «обучается», то есть уточняются критерии, на основании которых устанавливается принадлежность объекта к тому или иному классу. Эти критерии хранятся в блоке памяти.

Предположим, что области сепарабельны. Тогда «обучение» будет заключаться в том, чтобы для каждой области найти решающую функцию такую, что если

то вектор существенных признаков .

Существуют различные способы отыскания таких решающих функций, или решающих правил. Одним из наиболее наглядных методов их определения является представление множества признаков объектов в виде векторного пространства, в котором выполняется распознавание. При этом классы образуются путем построения разделяющих поверхностей, которые разбивают пространство на отдельные области. Каждая такая отдельная область соответствует определенному классу объектов.