Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
_ТР_ЭлК_2012__Шестаков.doc
Скачиваний:
36
Добавлен:
26.09.2019
Размер:
11.56 Mб
Скачать

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Факультет радиофизики и компьютерных технологий

Кафедра интеллектуальных систем

Курс лекций

по курсу

«Теория распознавания»

Учебное пособие для студентов

факультета радиофизики и компьютерных технологий

Электронная версия

для специальности: 1-34 04 02 Радиофизика

Минск

2012

УДК 681.31:621.38

ББК 32.841я43+32.85я43

ISBN 5-06-0004597

Р е ц е н з е н т ы

Рекомендовано

Советом факультета радиофизики и компьютерных технологий

__ __________2012 г., протокол №___

Р15

Шестаков К. М.

Курс лекций по курсу «Теория распознавания». Учебное пособие для студентов факультета радиофизики и компьютерных технологий. Электронная версия. – Мн.: БГУ, 2012. – 169 с.

ISBN 985-445-093

Рассматривается методика формирования описаний классов и ситуаций, нахождение разделяющих поверхностей, учет матриц риска при формировании окончательного вывода, составления алфавита признаков и его минимизации, распознавания образов по цветовому описанию, геометрическим параметрам и т.п. Теория распознавания является и теоретической основой методик оценки качества формирования виртуальных объектов в тренажерах. Теоретические сведения помогают разрабатывать рациональные алгоритмы процедур распознавания образов и реализовывать их в современных средах программирования.

Предназначено для студентов факультета радиофизики и компьютерных технологий.

ISBN 5-06-0004597

УДК 681.31:621.38

ББК 32.841я43+32.85я43

© БГУ, 2012

Введение

Создание искусственных систем распознавания остаётся сложной теоретической и технической проблемой. Необходимость в таком распознавании возникает в самых разных областях — от военного дела и систем безопасности до оцифровки всевозможных аналоговых сигналов. Промышленность развитых стран, банковские структуры, службы охраны, правоохранительные органы широко используют системы технического зрения для управления технологическими процессами, сортировки изделий, автоматизированной дактилоскопии, охраны и т. п. Применение этих систем создает базу для построения полностью автоматизированных производств, роботизированных предприятий торговли и т.д. Развитее компьютерных технологий в последнее десятилетие вывело в практическую плоскость задачу создания систем с элементами искусственного интеллекта, важнейшим свойством которых является умение распознавать ситуации, образы. Рост вычислительной мощности цифровых систем обработки данных, удешевление компонентов мультимедийной аппаратуры сделали реальными, в приемлемом диапазоне цен, разработку и создание автоматизированных комплексов по идентификации объектов на базе их двумерных и трехмерных описаний. Использование таких комплексов в охранных системах банков, различных предприятий работающих с клиентами позволит повысить качество обслуживания и надежность проводимых операций, а также позволит автоматизировать технологический процесс сборки и контроля промышленной продукции, особенно на конвейерах. Круг задач, которые могут решаться с помощью распознающих систем, чрезвычайно широк. Сюда относятся не только задачи распознавания зрительных и слуховых образов, но и задачи классификации сложных процессов и явлений, возникающих, например, при выборе целесообразных действий руководителем предприятия или выборе оптимального управления технологическими, экономическими, транспортными или военными задачами. Прежде чем начать анализ какого-либо объекта, нужно получить о нем определенную, упорядоченную информацию. Выбор исходного описания объектов является одной из центральных задач проблемы распознавания. При удачном выборе исходного описания (пространства признаков) задача распознавания может оказаться тривиальной и, наоборот, неудачно выбранное исходное описание может привести либо к очень сложной дальнейшей переработке информации, либо вообще к отсутствию решения.

Проблема распознавания образов изображений в настоящее время привлекают внимание многих исследователей, т.к. являются наиболее значительными областями применения и развития. Теории саморегулирующихся систем дают в распоряжение физиологов и психологов разнообразные методы и средства для выяснения процессов восприятия формы, обучения и распознавания, происходящих в живых организмах. Методы и алгоритмы теории распознавания широко используются в медицине и геологии, при изучении природных ресурсов Земли. Успехи в области изучения земных ресурсов аэрокосмическими средствами, проектировании роботов, автоматизации аэрокосмических наблюдений и других, связанных с обработкой больших массивов сложной информации различной природы, обостряют потребность в подготовке специалистов в области распознавания.

Насчитывающая уже более полстолетия своего развития теория распознавания выступает самостоятельным направлением прикладной математики со своими задачами, аппаратом и методологией. В ее область влияния включены и родственные задачи радиотехники, такие как обнаружение векторных, скалярных сигналов на фоне сложных помех, пространственная когерентная компенсация мешающих излучений.

Быстрыми темпами растет число доступных баз данных открытого доступа, позволяющих отрабатывать оригинальные алгоритмы распознавания. Ниже приведен перечень восьми из них: ALOI (ссылка на сайт) — база изображений 1000 предметов, созданная в Амстердамском университете; NORB Dataset (ссылка на сайт) — база изображений для тестирования алгоритмов распознавания трехмерных объектов, подготовленная в Нью-Йоркском университете; MNIST database of handwritten digits (ссылка на сайт) — база изображений рукописных цифр, созданная в Нью-Йоркском университете на основе изображений из баз образцов рукописных символов Национального института стандартов и технологий (США); NIST Mugshot Identification Database (ссылка на сайт) — база изображений лиц, подготовленная Национальным институтом стандартов и технологий (США), база содержит 3248 фронтальных и профильных изображений 1573 человек (1495 мужчин и 78 женщин); AR Face Database (ссылка на сайт) — база изображений лиц, созданная в автономном университете Барселоны (Испания). Содержит более 4000 фронтальных изображений 126 человек (70 мужчин и 56 женщин). Набор изображений для каждого человека включает изображения с разными выражениями лица, при различных условиях освещения, с частично закрытым лицом; Yale Face Database B (ссылка на сайт) — база изображений лиц, подготовленная в Йельском университете. Содержит 5850 фронтальных изображений 10 человек. Изображения в серии для каждого человека отличаются ракурсом съемки и условиями освещения; FVC2000 Fingerprint Databases (ссылка на сайт) — четыре базы изображений отпечатков пальцев, подготовленные для международного конкурса алгоритмов верификации по отпечаткам пальцев FVC-2000. В каждой базе содержится 880 изображений для 110 пальцев; CVRL Data Sets (Notre Dame Datasets) (ссылка на сайт) — базы биометрических изображений (2D и 3D лица, радужка глаза) созданная в Computer Vision Research Laboratory, Department of Computer Science and Engineering, University of Notre Dame. Приведенные базы данных не претендуют на рейтинговые места в задачах распознавания, но позволяют работать над материалом курса предметно.

Ряд научно-исследовательских программ стали международными, доступными для участия в них специалистами и студентами многих стран. Например, Open Source программа, направленная на разработку и совершенствование программного обеспечения роботов PR2. На голове PR2 расположены несколько вариантов видеокамер, текстурный проектор. Дано 50 стандартных предметов. Нужно: распознать один объект в различных положениях; распознать много объектов в различных положениях; распознать и идентифицировать (узнать) объект в различных положениях; распознать и идентифицировать (узнать) множество объектов в различных положениях. Широко используются и конкурсы практически ежегодные проводимые в среде разработчиков систем распознавания.

В программы квалификационных комиссий различного уровня включаются вопросы по теории распознавания, в том числе: методы распознавания образов; классификация методов распознавания; расстояние между классами; расстояние между списками; критерии сходства; вероятностное распознавание; байесовский подход; решающее правило; разделение на два класса; разделяющие функции; кусочно-линейные разделяющие функции; обучение; метод потенциалов; иерархическая группировка; определение иерархии; построение иерархии. Группирование методом динамических ядер. Алгоритм классификации. Статистическая проверка гипотез. Основные определения и понятия: простые и сложные гипотезы; критическая область, критерии проверки гипотез, вероятность ошибок 1-го и 2-го родов, уровень значимости, мощность критерия и т.д. Основная идея статистической проверки гипотез. Основные методы статистической проверки параметрических гипотез: байесовского минимального риска, минимакса, максимального правдоподобия и т.д. Понятие о последовательных методах статистической проверки гипотез: метод Вальда, усеченный последовательный метод Вальда. Статистическая проверка непараметрических гипотез. Критерии согласия: хи - квадрат, Колмогорова, омега - квадрат.

Есть немало областей приложения компьютерных технологий, которые базируются на аппарате теории распознавания. К ним относятся задачи создания систем маскировки, тренажерной техники, где формулируются задания по созданию не распознаваемых пользователями объектов самой различной природы. Построение виртуальных миров также предполагает применение упрощенных математических моделей объектов, позволяющих создавать объекты с не различимым пользователем функционированием и взаимодействием. В методике программирования на подходе парадигмы интеллектуализации программ. Это означает добавление методов распознавания действий пользователей, предсказания их дальнейших запросов, а также возможности автоматического вызова других программ, способных решать возникающие задачи.

С другой стороны, теория распознавания стремится поглотить все сложные процедуры обработки сигналов, близкие к оптимальным. Здесь вероятно, правильно считать приложения теории распознавания обоснованными в тех случаях, когда существует два или более квазиоптимальных решения, дающих различные результаты. В этом случае теория распознавания продолжает, дополняет теорию оптимальной обработки сигналов.

К новому направлению в инженерных технологиях, тесно связанному с теорией распознавания, можно отнести обратный инжиниринг (рис.В.1). В процессе сканирования по объекту формируется трехмерное облако точек, в нем распознаются стандартные примитивы, воспроизводимые оборудованием и программными пакетами 3D моделирования и проектирования.

Рис.В.1. Последовательность действий в обратном инжиниринге