- •4.1. Синтез байесовских решающих функций
- •4.2. Непараметрические оценки решающих функций
- •4.3. Непараметрические алгоритмы распознавания образов коллективного типа
- •4.4. Синтез и анализ непараметрического решающего правила, основанного на оценках плотностей вероятности
- •4.5. Частотные алгоритмы распознавания образов в пространстве дискретных признаков
- •4.6. Непараметрический алгоритм классификации, основанный на частотном методе распознавания образов
- •4.7. Многоуровневые системы распознавания образов
- •4.8. Непараметрические алгоритмы распознавания образов с учётом взаимосвязи между признаками
- •4.9. Нелинейные непараметрические коллективы решающих правил в задачах распознавания образов
- •4.11. Непараметрические алгоритмы распознавания образов, основанные на рандомизированном методе их идентификации
- •4.12. Непараметрические алгоритмы классификации множеств случайных величин
- •Литература
- •Дополнительная литература
- •Контрольные вопросы
- •Контрольные упражнения
4.7. Многоуровневые системы распознавания образов
Предлагается новое эффективное направление построения непараметрических систем классификации больших массивов разнотипных данных, основанное на условно-последовательных процедурах формирования решений. Иерархическую их структуру образуют этапы обработки исходной и промежуточной информации в пространстве различных наборов признаков с помощью локальных распознающих устройств, а взаимосвязи между ними – последовательность формирования конечного решения. При этом каждый последующий этап классификации осуществляется в области неоднозначных решений предыдущего этапа. В отличие от традиционных подходов многоуровневые системы распознавания образов обеспечивают большую вычислительную эффективность процедуры классификации и рациональное использование априорной информации.
Рассмотрим методику построения многоуровневых систем на примере двуальтернативной задачи распознавания образов в пространстве непрерывных признаков.
Пусть - обучающая выборка, составленная из значений признаков классифицируемых объектов и соответствующих им «указаний учителя»
Разобьём признаки на групп, основываясь, например, на времени их контроля либо в соответствии с особенностями прикладной задачи.
Широкое распространение последовательных методов обработки данных в задачах распознавания образов объясняется возможностью их разбиения на ряд задач принятия решений по ограниченным наборам признаков . Каждый этап процесса обработки сигнала реализуется решающим правилом
(4.23)
Здесь алгоритм осуществляет распознавание в пространстве признаков при условии принадлежности области пересечения классов .
Уравнения разделяющих поверхностей , между классами , будем восстанавливать с помощью непараметрических оценок
, , (4.24)
где - ядерные функции, удовлетворяющие условиям положительности, симметричности, нормированности и имеют конечные центральные моменты; - множество номеров точек обучающей выборки, принадлежащих области пересечения классов в пространстве , а - их количество.
Обучающая выборка для оценивания в соответствии со статистикой (4.24) формируется по правилу
.
Рис. 4.8. Структура многоуровневой системы распознавания образов |
На первом уровне структуры непараметрическое решающее правило строится по выборке (рис.4.8). Для достижения большей вычислительной эффективности алгоритма целесообразно в первый набор включать наиболее информативные признаки, т.к. в этом случае повышается вероятность решения задачи распознавания уже на первом её этапе. Последующие наборы должны состоять из менее информативных признаков. |
Например, при двуальтернативной задачи распознавания образов при количестве признаков и структура многоуровневой системы имеет вид (рис. 4.9).
Рис. 4.9. Структура многоуровневой системы для двуальтернативной задачи распознавания образов при и .
Решение о принадлежности сигнала с набором признаков принимается на первом этапе, так ка он поподает в облать однозначного принятия решений. Если точка попадает в область пересечения классов, то переходим ко второму алгоритму, где сигнал классифицируется в пространстве признаков 2-го этапа. Для этой стадии объём выборки составляют точки попавшие в область пересечения классов в первой стадии . В этом случае окончательное решение принимается на заключительном втором этапе.
Данная система классификации эффективна для «обхода» проблем обработки разнотипных данных в задаче распознавания образов. Идея предлагаемого подхода состоит в формировании наборов однотипных признаков из исходных, измеренных в различных шкалах, и сопоставлении им этапов последовательной процедуры принятия решений. При этом каждый последующий этап классификации осуществляется в области неоднозначных решений предыдущего этапа. Таким образом линейную структуру системы образуют этапы обработки исходной и промежуточной информации с помощью локальных распознающих устройств, а взаимосвязи между ними отражают порядок формирования конечного решения.
Рассмоторим применение многоуровневой системы классификации в медицинской диагностики. Для данного примера определим два класса: болен, здоров. Пациент, чувствуя недомогание, приходит к врачу (этап 1). Врач проводит предварительный осмотр: измеряет давление, температуру и учитывает возраст, рост, вес пациента. Если решение однозначно здоров или болен, то на этом алгоритм прерывается, т.е. если болен, ставится диагноз, выписывается лекарство и назначается лечение. Но если врач не уверен, то наступает второй этап. Врач отправляет пациента на дополнительные анализы и, проведя их, с определённой долей точности может сделать заключение: болен либо здоров.