
- •«Обработка изображений и распознавание образов» Визильтер Юрий Валентинович Методическое пособие-2010
- •Раздел 2. Распознавание образов. 165
- •1.1. Задачи и приложения машинного зрения. Примеры практических приложений.
- •Уровни и методы машинного зрения
- •Растровое изображение Изображение как двумерный массив данных
- •Алгебраические операции над изображениями
- •Физическая природа изображений
- •Изображения различных диапазонов длин волн
- •Изображения различной физической природы
- •Тип пикселя
- •Возможности и особенности системыPisoft
- •Базовые средства просмотра и анализа изображений и видеопоследовательностей
- •Алгебра изображений
- •Геометрические преобразования изображений
- •Устройства оцифровки и ввода изображений
- •Линейки и матрицы, сканеры и камеры
- •Геометрия изображения
- •Цифровые и аналоговые устройства
- •Пространственное разрешение
- •Программное обеспечение
- •Обработка цветных изображений
- •Цветовая модельRgb
- •Цветовая модель hsv
- •Цветовая модель yuv
- •Цветовая сегментация изображения
- •Гистограмма и гистограммная обработка изображений
- •Профиль вдоль линии и анализ профиля
- •Проекция и анализ проекции
- •Бинаризация полутоновых изображений
- •Сегментация многомодальных изображений
- •Выделение и описание областей
- •Выделение связных областей на бинарных изображениях
- •1. Отслеживающие алгоритмы на примере алгоритма обхода контура.
- •2. Сканируюющие алгоритмы.
- •1.3. Фильтрация. Выделение объектов при помощи фильтров
- •Оконная фильтрация изображений в пространственной области
- •Фильтрация бинарных изображений Модель шума «соль и перец»
- •Структура оконного фильтра
- •Логическая фильтрация помех
- •Бинарная медианная фильтрация
- •Бинарная ранговая фильтрация
- •Взвешенные ранговые фильтры
- •Анизотропная фильтрация
- •Расширение-сжатие (простая морфология)
- •Стирание бахромы
- •Нелинейная фильтрация полутоновых изображений
- •Ранговая оконная фильтрация
- •Минимаксная фильтрация
- •Задача выделения объектов интереса
- •Бинарные фильтры для выделения объектов
- •Метод нормализации фона
- •Скользящее среднее в окне
- •Гауссовская фильтрация
- •Преобразование Фурье. Линейная фильтрация в частотной области
- •Преобразование Фурье
- •Комплексное представление преобразования Фурье
- •Быстрое преобразование Фурье
- •Двумерное преобразование Фурье
- •Свертка с использованием преобразования Фурье
- •Фильтрация изображений в частотной области
- •Вейвлет-анализ
- •Пирамида изображений
- •Вейвлет-преобразование
- •Операторы вычисления производных
- •Операторы вычисления векторов градиентов
- •Операторы Марра и Лапласа
- •Постобработка контурного изображения Локализация края
- •Утончение контура
- •Сегментация полутоновых изображений
- •Пороговая и мультипороговая сегментация
- •Методы слияния, разбиения и слияния/разбиения областей
- •Способы описания выделенных областей
- •Текстурные признаки
- •1.6.Морфологические методы анализа сцен (по ю.П. Пытьеву) Методы обнаружения объектов, заданных эталонами
- •Согласованная фильтрация.
- •Корреляционное обнаружение.
- •Морфологический подход ю.П. Пытьева.
- •Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации
- •Сравнение изображений по форме
- •Выделение отличий изображений по форме
- •Обнаружение объекта по его изображению и оценка его координат
- •*Морфология на базе кусочно-линейной интерполяции
- •Преобразование Хафа для поиска прямых
- •*Различные способы параметризации прямых
- •Преобразование Хафа для поиска окружностей
- •Анализ аккумулятора при поиске геометрических примитивов
- •Обобщенное преобразование Хафа
- •*Специализированная процедура голосования для поиска эллипсов
- •*Рекуррентное преобразование Хафа в скользящем окне
- •1.8.Математическая морфология (по ж. Серра)
- •Морфологические операции на бинарных изображениях
- •Морфологические операции на полутоновых изображениях
- •Морфологическое выделение «черт» и объектов
- •Морфологический спектр
- •Морфологические скелеты. Непрерывная бинарная морфология Непрерывная бинарная морфология
- •Непрерывное гранично-скелетное представление изображения
- •Обработка и использование скелета
- •*Обобщенные скелетные представления бинарных фигур
- •Алгоритмы утончения дискретного бинарного изображения
- •*Регуляризация скелетов
- •Типы нерегулярностей скелета
- •Устранение нерегулярностей
- •Регуляризация скелета по Тихонову
- •*Селективные морфологии
- •1.9. Анализ движения. Выделение движущихся объектов. Разность кадров. Вычитание фона. Анализ оптических потоков. Слежение за движущимися объектами. Корреляционное слежение.
- •Обучение с учителем. Детерминированные методы, основанные на «близости». Линейные решающие правила. Метод построения эталонов. Метод ближайшего соседа. Методkближайших соседей.
- •Линейные решающие правила
- •Метод построения эталонов
- •Методы ближайших соседей
- •Параметрические и непараметрические методы
- •Дискриминантные и моделирующие методы обучения
- •Способность распознавателя к обобщению. Регуляризация.
- •Байесовская теория решений. Случай двух классов. Классификаторы, разделяющие функции и поверхности решений. Вероятности ошибок. Разделяющие функции для случая нормальной плотности.
- •Дискриминантный анализ. Линейный дискриминант Фишера. Персептронная функция критерия. Линейный дискриминантный анализ (lda,дискриминант Фишера)
- •Персептрон Розенблатта
- •Анализ свидетельств
- •Байесовское объединение свидетельств
- •Структурное распознавание
- •Автоматизированное конструирование алгоритмов обнаружения объектов на основе преобразований модельных описаний объектов.
- •Нейросетевое распознавание
- •Нейронные сети ассоциативной памяти. Сети Хопфилда.
- •Многослойные персептроны. Оптимизационное обучение. Метод обратного распространения ошибки.
- •Многослойные персептроны. Правило Хебба.
- •*Связь с байесовским распознаванием
- •Сети встречного распространения. Самоорганизующиеся сети.
Пространственное разрешение
Важной характеристикой любого устройства ввода изображения является его разрешение. Различаютяркостное разрешение(о котором речь, в частности, пойдет в следующем разделе) ипространственное разрешение. В свою очередь, о пространственном разрешении говорят в двух основных смыслах – как о собственной характеристике устройства ввода и как о характеристике съемки данным устройством реальногообъектного пространства(пространства сцены).
Собственное разрешениекамеры или сканера – это количество элементов изображения на кадр, которое данное устройство может обеспечить.
О собственном разрешении аналоговых видеокамер обычно говорят в терминах телевизионных линий (ТВЛ). При этом считается, что разрешение ниже 200 ТВЛ является «низким», разрешение порядка 400–500 ТВЛ – «среднее», а разрешение в 600–800 ТВЛ и выше – высокое.
Собственное разрешение цифрового фотоаппарата оценивается в мегапикселях(Мпикс) – количестве пикселей цветного изображения максимального размера, которое в состоянии сформировать данный фотоаппарат. На сегодняшний день разрешение ниже 1 Мпикс считается «низким», разрешение порядка 3–5 Мпикс – «средним», а разрешение выше 10 Мпикс – «высоким».
Собственное разрешение цифровых видеокамер и фреймграбберов определяется размером выходного изображения в пикселях. Разрешение ниже 320200 считается «низким», разрешение порядка 640480576768 считается «средним», а разрешение более 10241024 – «высоким».
Собственное разрешение оптического сканера на основе сканирующей линейки характеризуется количеством элементов линейки.
Следует сразу заметить, что качественные оценки «низкого» или «высокого» разрешения по ходу развития современной техники постоянно подвергаются пересмотру в сторону увеличения пороговых значений. Лишь несколько лет назад стандарт VGA640480 считался эталоном «высокого» разрешения. Поэтому данные качественные градации можно использовать только в качестве самых приблизительных ориентиров. На практике, при выборе оборудования видеоввода для построения той или иной аппаратно-программной системы машинного зрения выбор типа камеры или сканера осуществляется, как правило, на основе требований не к собственному, а к внешнему пространственному разрешению.
Внешнее пространственное разрешениепо своему смыслу характеризует размер мельчайших деталей реальной сцены, которые можно различить на изображении.
Традиционно для характеристики пространственного разрешения аналоговых телевизионных систем применялся критерий количества пар различимых линий. Имеется в виду следующий тестовый эксперимент. Пусть имеется тестовое изображение (таблица,testfield), состоящее из вертикальных линий ширинойW, разделенных промежутками толщиной такжеW. В такой таблице ширина пары близко расположенных линий будет 2W, и на некоторой единице длины разместится соответственно 1/2Wтаких пар линий. В этом смысле говорят, что данное устройство обеспечивает, например, 100 различимых пар линий на миллиметр объектного пространства.
Для цифровых фотоаппаратов, цифровых видеокамер и фреймграбберов удобнее использовать такую характеристику внешнего разрешения как цена пикселяилипиксельное разрешение. Допустим, собственное разрешение камеры по горизонтали составляет 640 пикселей. Пусть при этом производится съемка некоторой области объектного пространства, горизонтальный размер которой составляет (на стандартной дальности съемки) порядка 6,4 метра. Тогда внешнее пространственное разрешение одного пикселя в горизонтальном направлении составит соответственно 6,4м/640=0,01м=1см.
Для оптических сканеров, предназначенных для сканирования документов, исторически утвердилась такая характеристика внешнего разрешения как DPI (dots per inch)– количество отсканированных точек на дюйм расстояния. Если внешнее разрешение камер и фотоаппаратов нельзя охарактеризовать как заведомо низкое или высокое, поскольку такая оценка зависит от оптики (при замене объектива на объектив с другим фокусным расстоянием внешнее разрешение системы сразу изменяется) и требований данной конкретной задачи (большая или меньшая точность измерений нам нужна), то для сканерной характеристикиDPIтакие качественные оценки существуют. Они связаны с требованиями систем автоматического распознавания текстов, а также с требованиями издательских систем к растровым изображениям, отсканированным для печати. Считается, что разрешение ниже 300dpi– это «низкое» разрешение, порядка 600dpi– «нормальное» или «среднее» разрешение, а свыше 1200dpi– «высокое» разрешение. Часто производители оптических сканеров указывают для своих продуктов сразу две характеристики разрешения – «физическое» и «математическое» разрешение, причем «математическое» разрешение как минимум в два раза выше физического. Это объясняется тем, что в аппаратное или программное обеспечение сканера зашивается алгоритм межпиксельной интерполяции изображения, позволяющий создавать иллюзию более высокого разрешения, чем физически позволяет достигать количество элементов сканирующей линейки. На самом деле при выборе сканера для вашей конкретной задачи всегда следует опираться только на указанное «физическое» разрешение устройства.
Маленькое методическое замечание в заключение параграфа о разрешении. Почему и в каком смысле размер цифрового изображения является мерой его разрешения, если мы не знаем и не можем знать заранее, каково будет внешнее разрешение, полученное в дальнейшем «на местности»? Видимо, дело в том, что, опираясь на знание размера изображения (DimXDimY), мы все-таки можем априори сказать, что разрешение на местности составит соответственноLX/DimXиLY/DimY, где (LXLY) – размер поля зрения камеры в объектном пространстве. То есть разрешение цифрового изображения в пикселях обусловливает максимально возможное внешнееразрешение в относительных единицах– долях максимального размера регистрируемого объекта.