Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
full_version (1).doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.02 Mб
Скачать

40.Задача распознавания с учителем. Метод комитетов.

Будем считать, что в пространстве признаков заданы некоторые точки. Эти точки являются кодами некоторых реальных объектов. Пусть эти объекты являются объектыми, принадлежащими некоторым образам. Если для части объектов заранее известны образы, к которым они принадлежат, и при построении разделяющей образы поверхности эта ин­формация используется, то такие задачи распознавания называются задачами обучения с учителем. Используе­мые объекты называются обучающей последователь­ностью, а построение разделяющей поверхности - обу­чением. После того как задача распознавания решена и в пространстве признаков построена разделяющая по­верхность, все вновь поступающие объекты будут относиться к тому или иному образу в зависимости от того, в какую относительно поверхности часть пространства они попали.

Определение. Комитетом совокупности объектов из двух классов называется множество плоскостей в прост­ранстве объектов, обладающих тем свойством, что каждый объект правильно классифицируется более чем половиной из плоскостей.

Можно доказать, что при некоторых условиях комитет обязательно существует.

Содержательно комитет означает следующее. В том случае, когда обучающая последовательность, вообще говоря, не разделяется плоскостью, образуется набор плоскостей, называемых комитетом и обладающих сле­дующим свойством:

число ошибочных отнесений каждого объекты обучающей последовательности при разделении простран­ства признаков плоскостями из комитета меньше половины числа плоскостей.

Таким образом, комитет как бы имеет коллективное мнение о том, к какому классу принадлежит объект, причем «большинство» комитета имеет мнение, отвечающее истинной классификации объекты.

Комитет строится по обучающей последовательности объектов x1, …, xr . После построения комитета (обучения) объекты, попадающие на распознавание, относятся в тот класс, к которому их относит большая часть плоскостей.

Естественно, что основной проблемой данного метода является поиск комитета совокупности объектов (обучение).

В настоящее время существуют пакеты прикладных программ, в которых реализован метод комитетов, например, ППП Квазар, ПАРК и другие.

Этот метод является в некотором смысле обобщением идеи разделения классов в пространстве признаков наиболее простой поверхностью.

41.Задачи, решаемые алгоритмами распознавания, основанными на вычислении оценок.

Основная задача ВО. Пусть задана таблица обучения Tn,r и некоторое объект s на Х. Требуется указать класс Kj , j = 1, 2,…, L, к которому принадлежит объект s.

Перейдем теперь к описанию класса алгоритмов, решающих основную задачу. Будем называть этот класс классом алгоритмов, основанных на ВО, а каждый конкретный алгоритм - алгоритмом ВО. Класс алгоритмов, основанных на ВО, задается посредством описания шести элементов его определяющих.

1. система опорных множеств,

2. функция близости,

3. ВО по строкам фиксированного опорного множества,

4. ВО для класса по опорному множеству,

5. оценка для класса по системе опорных множеств,

6. решающее правило.

Любой алгоритм распознавания, задание которого складывается из шести элементов, и будет алгоритмом вычисления оценок, представляющих собой совокупность всевозможных алгоритмов распознавания, задаваемых рассматриваемыми шестью элементами.

Задание алгоритма ВО.

А. Система - опорных множеств. Под опорным мно­жеством будем подразумевать некоторый набор номе­ров столбцов таблицы обучения T n, r . Под системой опорных множеств будем подразуме­вать совокупность опорных множеств, задаваемых из со­держательных соображений при определении алгоритма, основанного на ВО. Например, система может состоять из одного набора, включающего все столб­цы, т.е. столбцы с номерами 1, 2, . . ., n.

Б. Функция близости. Пусть xi и xp - некоторые объекты. Пусть задана функция r(xi,xp), которая описы­вает степень похожести объектов xi и xp на основе анализа только по одному из опорных множеств. Ее и будем называть функцией близости.

Пример. r = 1, если xi и xp совпадают на столбцах, входящих в некоторое опорное множество, и r = 0 - в противном случае.

Строки считаются похожими, если эти части совпадают.

Очевидно, что для каждого опорного множества можно вычислить функцию близости. Выбор той или иной функции близости определяется содержательными соображениями.

В. ВО по строкам фиксированного опорного множества.

Рассматриваемый пункт (элемент) класса алгоритмов распознавания, основанных на ВО, означает учет степени важности, представитель­ности объектов, входящих в обучающую последова­тельность. Другими словами, пусть априорно задаются числовые коэффициенты γ1,…,γr ,характеризующие важность объектов

x1 ,…,xr .

Тогда определяем оценку по строкам фиксированного опорного множества как некоторую заданную функцию от функции близос­ти и коэффициентов γ1 ,…, γr .

Пример. = γi r, если функция близости вычисляется между объектами xi и xp по некоторому опорному множеству. Таким об­разом, - это близость по опорному множеству с уче­том важности.

Г. ВО для класса по опорному мно­жеству. Оценка Г* для класса по опорному множеству означает вычисление близости между всеми объекты­ми из одного класса и некоторым объектм, отно­сительно которого эта близость вычисляется. Эта бли­зость вычисляется с учетом важности объектов по фиксированному опорному множеству. Например, если опорное множество представляет собой набор столбцов i1,…,ik , а к классу Km относятся объекты

xr +1 , … ,xr , то оценку Г* для класса Km по опор­ному множеству i1 ,…, ik для произвольного объекты xp можно вычислить так:

Г* = γ r +1 *r (xr +1 , xp)+…+γr *r(xr , xp).

Д. Оценка для класса Km по системе опорных множеств.

Оценки Гm для класса Km по системе опорных множеств означает близость произвольного объекты xp к объектым из класса Km по всем опорным мно­жествам из системы опорных множеств. Например, в ка­честве оценки Гт можно взять сумму всех оценок Г*, полученных для каждого опорного множества.

Е. Решающее правило. Пусть по системе опорных множеств к объекту xp вычислены оценки Г1,......, ГL . Под решающим правилом будем подразумевать правило, которое по оценкам Г1,......, ГL выносит сужде­ние о принадлежности xp классам K1 , … , КL .

При­мер.

xp относится к классу Kj , если Гj - наибольшая оценка из Г1, . . ., ГL.

На этом описание алгоритмов распознавания, осно­ванных на вычислении оценок, завершается.

Таким об­разом, можно сказать, что (1) выбирая конкретную систему опорных множеств, (2) определяя функцию близости, (3) зада­вая правила ВО по строкам фиксирован­ного опорного множества, (4) для класса по опорному мно­жеству и (5) по системе опорных множеств, а также (6) назна­чая решающее правило, мы получаем некоторый конкретный алгоритм ВО. Класс же алгоритмов распознавания, основанных на ВО, включает в себя всевозможные алгоритмы, которые могут быть построены из рассмотренных шести элементов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]