
- •«Обработка изображений и распознавание образов» Визильтер Юрий Валентинович Методическое пособие-2010
- •Раздел 2. Распознавание образов. 165
- •1.1. Задачи и приложения машинного зрения. Примеры практических приложений.
- •Уровни и методы машинного зрения
- •Растровое изображение Изображение как двумерный массив данных
- •Алгебраические операции над изображениями
- •Физическая природа изображений
- •Изображения различных диапазонов длин волн
- •Изображения различной физической природы
- •Тип пикселя
- •Возможности и особенности системыPisoft
- •Базовые средства просмотра и анализа изображений и видеопоследовательностей
- •Алгебра изображений
- •Геометрические преобразования изображений
- •Устройства оцифровки и ввода изображений
- •Линейки и матрицы, сканеры и камеры
- •Геометрия изображения
- •Цифровые и аналоговые устройства
- •Пространственное разрешение
- •Программное обеспечение
- •Обработка цветных изображений
- •Цветовая модельRgb
- •Цветовая модель hsv
- •Цветовая модель yuv
- •Цветовая сегментация изображения
- •Гистограмма и гистограммная обработка изображений
- •Профиль вдоль линии и анализ профиля
- •Проекция и анализ проекции
- •Бинаризация полутоновых изображений
- •Сегментация многомодальных изображений
- •Выделение и описание областей
- •Выделение связных областей на бинарных изображениях
- •1. Отслеживающие алгоритмы на примере алгоритма обхода контура.
- •2. Сканируюющие алгоритмы.
- •1.3. Фильтрация. Выделение объектов при помощи фильтров
- •Оконная фильтрация изображений в пространственной области
- •Фильтрация бинарных изображений Модель шума «соль и перец»
- •Структура оконного фильтра
- •Логическая фильтрация помех
- •Бинарная медианная фильтрация
- •Бинарная ранговая фильтрация
- •Взвешенные ранговые фильтры
- •Анизотропная фильтрация
- •Расширение-сжатие (простая морфология)
- •Стирание бахромы
- •Нелинейная фильтрация полутоновых изображений
- •Ранговая оконная фильтрация
- •Минимаксная фильтрация
- •Задача выделения объектов интереса
- •Бинарные фильтры для выделения объектов
- •Метод нормализации фона
- •Скользящее среднее в окне
- •Гауссовская фильтрация
- •Преобразование Фурье. Линейная фильтрация в частотной области
- •Преобразование Фурье
- •Комплексное представление преобразования Фурье
- •Быстрое преобразование Фурье
- •Двумерное преобразование Фурье
- •Свертка с использованием преобразования Фурье
- •Фильтрация изображений в частотной области
- •Вейвлет-анализ
- •Пирамида изображений
- •Вейвлет-преобразование
- •Операторы вычисления производных
- •Операторы вычисления векторов градиентов
- •Операторы Марра и Лапласа
- •Постобработка контурного изображения Локализация края
- •Утончение контура
- •Сегментация полутоновых изображений
- •Пороговая и мультипороговая сегментация
- •Методы слияния, разбиения и слияния/разбиения областей
- •Способы описания выделенных областей
- •Текстурные признаки
- •1.6.Морфологические методы анализа сцен (по ю.П. Пытьеву) Методы обнаружения объектов, заданных эталонами
- •Согласованная фильтрация.
- •Корреляционное обнаружение.
- •Морфологический подход ю.П. Пытьева.
- •Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации
- •Сравнение изображений по форме
- •Выделение отличий изображений по форме
- •Обнаружение объекта по его изображению и оценка его координат
- •*Морфология на базе кусочно-линейной интерполяции
- •Преобразование Хафа для поиска прямых
- •*Различные способы параметризации прямых
- •Преобразование Хафа для поиска окружностей
- •Анализ аккумулятора при поиске геометрических примитивов
- •Обобщенное преобразование Хафа
- •*Специализированная процедура голосования для поиска эллипсов
- •*Рекуррентное преобразование Хафа в скользящем окне
- •1.8.Математическая морфология (по ж. Серра)
- •Морфологические операции на бинарных изображениях
- •Морфологические операции на полутоновых изображениях
- •Морфологическое выделение «черт» и объектов
- •Морфологический спектр
- •Морфологические скелеты. Непрерывная бинарная морфология Непрерывная бинарная морфология
- •Непрерывное гранично-скелетное представление изображения
- •Обработка и использование скелета
- •*Обобщенные скелетные представления бинарных фигур
- •Алгоритмы утончения дискретного бинарного изображения
- •*Регуляризация скелетов
- •Типы нерегулярностей скелета
- •Устранение нерегулярностей
- •Регуляризация скелета по Тихонову
- •*Селективные морфологии
- •1.9. Анализ движения. Выделение движущихся объектов. Разность кадров. Вычитание фона. Анализ оптических потоков. Слежение за движущимися объектами. Корреляционное слежение.
- •Обучение с учителем. Детерминированные методы, основанные на «близости». Линейные решающие правила. Метод построения эталонов. Метод ближайшего соседа. Методkближайших соседей.
- •Линейные решающие правила
- •Метод построения эталонов
- •Методы ближайших соседей
- •Параметрические и непараметрические методы
- •Дискриминантные и моделирующие методы обучения
- •Способность распознавателя к обобщению. Регуляризация.
- •Байесовская теория решений. Случай двух классов. Классификаторы, разделяющие функции и поверхности решений. Вероятности ошибок. Разделяющие функции для случая нормальной плотности.
- •Дискриминантный анализ. Линейный дискриминант Фишера. Персептронная функция критерия. Линейный дискриминантный анализ (lda,дискриминант Фишера)
- •Персептрон Розенблатта
- •Анализ свидетельств
- •Байесовское объединение свидетельств
- •Структурное распознавание
- •Автоматизированное конструирование алгоритмов обнаружения объектов на основе преобразований модельных описаний объектов.
- •Нейросетевое распознавание
- •Нейронные сети ассоциативной памяти. Сети Хопфилда.
- •Многослойные персептроны. Оптимизационное обучение. Метод обратного распространения ошибки.
- •Многослойные персептроны. Правило Хебба.
- •*Связь с байесовским распознаванием
- •Сети встречного распространения. Самоорганизующиеся сети.
Изображения различной физической природы
Акустические изображенияактивно используются в геологии, промышленности и медицине.Ультразвуковые изображенияприменяются в множестве областей промышленности итехники, но наиболее известно их применение в медицине – для получения внутриматочных изображений человеческого плода в утробе матери, а также для быстрой инспекции патологий различных внутренних органов человека. Следует отметить, что медицинское ультразвуковое изображение содержит не просто интенсивность отраженного ультразвукового сигнала, а еще и дальность до отражающей поверхности, вычисленную на основе расчета скорости распространения ультразвукового сигнала в человеческих тканях.
Двумерные поля дальностейформируются на основе анализа электромагнитных сигналов, испускаемых и принимаемых по локационной схеме. В качестве таких дальнометрических систем в последние годы все чаще используютсялазерные локаторы, позволяющие осуществлять оптическое сканирование трехмерных поверхностей с больших расстояний (до десятков километров), обеспечивая при этом максимально возможное разрешение. Так же, как и в случае ультразвуковых картин, дальнометрический локатор сканирует поверхность, испуская серии коротких волновых импульсов, отражения которых от поверхности объекта регистрируются приемником локатора, после чего рассчитывается время прохождения импульса до объекта и обратно, откуда окончательно определяется дальность до точки поверхности объекта. Получаемое изображение называется в таком случаекартой глубини содержит непосредственные значения расстояний от локатора до точек поверхности объекта – то есть непосредственно измеренный трехмерный рельеф данной поверхности. Двумерные поля дальностей находят широкое применение в области картографии, дистанционного зондирования Земли, технических измерений и технического контроля в промышленности и многих других областях.
Двумерные поля скоростейформируются аналогичным образом – за счет излучения и приема волновых импульсов. Однако пиксели таких изображений содержат уже не значения расстояний до соответствующих точек, а значения скоростей движения этих точек отражающей поверхности. Вычисление скоростных характеристик осуществляется за счет анализадоплеровского сдвигаотраженного сигнала. В таком случае говорят, что локационное изображение имеет смыслкарты скоростей, а локатор работает в режимеСДЦ(селекции движущихся целей). Двумерные поля скоростей используются в системах различного назначения преимущественно в целях выделения движущихся объектов.
В заключение данного краткого обзора изображений различной физической природы необходимо отметить, что многие современные системы зрения основаны не на анализе изображений одного типа, а на комплексировании(fusion) двумерных данных, получаемых в различных диапазонах длин волн, а также данных, получаемых от устройств, основанных на различных физических принципах. В частности, в области исследований Земли из космоса стандартом сталамультиспектральная съемка(съемка Земной поверхности одновременно в нескольких диапазонах видимого света и ближнего ИК). Получаемые в результатемногозональные изображения,каждый пиксель которых имеет целый вектор значений, полученных в близких, но отличающихся спектральных диапазонах, позволяют с высокой надежностью автоматически выделять на этих изображениях области растительности разного вида, различные типы почв и т.д. и т.п. В последние годы речь идет уже не о многозональной, а огиперспектральнойсъемке, при которой задействуются уже не несколько, а десятки и даже сотни близко расположенных узких волновых диапазонов. С другой стороны, комбинирование источников изображений различной физической природы позволяет удачно «поделить» между ними функции единой системы машинного зрения. Например, робототехническая система, объединяющая установленные на единой платформе телекамеру высокого разрешения, тепловизор и локатор в режиме СДЦ имеет возможность быстро автоматически выделить в поле зрения только теплые движущиеся объекты, после чего внимательнее рассмотреть и проанализировать их форму и характеристики на детальном изображении видимого диапазона.
@Рис.1.1.3. Пример многоспектральных изображений. Показаны изображения городской сцены в ТВ и двух ИК диапазонах (3-5 и 8-14 мкм).