
- •«Обработка изображений и распознавание образов» Визильтер Юрий Валентинович Методическое пособие-2010
- •Раздел 2. Распознавание образов. 184
- •Уровни и методы машинного зрения
- •Растровое изображение Изображение как двумерный массив данных
- •Алгебраические операции над изображениями
- •Физическая природа изображений
- •Изображения различных диапазонов длин волн
- •Изображения различной физической природы
- •Тип пикселя
- •Возможности и особенности системы Pisoft
- •Базовые средства просмотра и анализа изображений и видеопоследовательностей
- •Алгебра изображений
- •Геометрические преобразования изображений
- •Устройства оцифровки и ввода изображений
- •Линейки и матрицы, сканеры и камеры
- •Геометрия изображения
- •Цифровые и аналоговые устройства
- •Пространственное разрешение
- •Программное обеспечение
- •Обработка цветных изображений
- •Цветовая модель rgb
- •Цветовая модель hsv
- •Цветовая модель yuv
- •Цветовая сегментация изображения
- •Гистограмма и гистограммная обработка изображений
- •Профиль вдоль линии и анализ профиля
- •Проекция и анализ проекции
- •Бинаризация полутоновых изображений
- •Сегментация многомодальных изображений
- •Выделение и описание областей
- •Выделение связных областей на бинарных изображениях
- •1. Отслеживающие алгоритмы на примере алгоритма обхода контура.
- •2. Сканируюющие алгоритмы.
- •Оконная фильтрация изображений в пространственной области
- •Фильтрация бинарных изображений Модель шума «соль и перец»
- •Структура оконного фильтра
- •Логическая фильтрация помех
- •Бинарная медианная фильтрация
- •Бинарная ранговая фильтрация
- •Взвешенные ранговые фильтры
- •Анизотропная фильтрация
- •Расширение-сжатие (простая морфология)
- •Стирание бахромы
- •Нелинейная фильтрация полутоновых изображений
- •Ранговая оконная фильтрация
- •Минимаксная фильтрация
- •Задача выделения объектов интереса
- •Бинарные фильтры для выделения объектов
- •Метод нормализации фона
- •Скользящее среднее в окне
- •Гауссовская фильтрация
- •Преобразование Фурье. Линейная фильтрация в частотной области
- •Преобразование Фурье
- •Комплексное представление преобразования Фурье
- •Быстрое преобразование Фурье
- •Двумерное преобразование Фурье
- •Свертка с использованием преобразования Фурье
- •Фильтрация изображений в частотной области
- •Вейвлет-анализ
- •Пирамида изображений
- •Вейвлет-преобразование
- •Операторы вычисления производных
- •Операторы вычисления векторов градиентов
- •Операторы Марра и Лапласа
- •Постобработка контурного изображения Локализация края
- •Утончение контура
- •Сегментация полутоновых изображений
- •Пороговая и мультипороговая сегментация
- •Методы слияния, разбиения и слияния/разбиения областей
- •Способы описания выделенных областей
- •Текстурные признаки
- •1.6. Морфологические методы анализа сцен (по ю.П. Пытьеву) Методы обнаружения объектов, заданных эталонами
- •Согласованная фильтрация.
- •Корреляционное обнаружение.
- •Морфологический подход ю.П. Пытьева.
- •Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации
- •Сравнение изображений по форме
- •Выделение отличий изображений по форме
- •Обнаружение объекта по его изображению и оценка его координат
- •*Морфология на базе кусочно-линейной интерполяции
- •Преобразование Хафа для поиска прямых
- •*Различные способы параметризации прямых
- •Преобразование Хафа для поиска окружностей
- •Анализ аккумулятора при поиске геометрических примитивов
- •Обобщенное преобразование Хафа
- •*Специализированная процедура голосования для поиска эллипсов
- •*Рекуррентное преобразование Хафа в скользящем окне
- •1.8. Математическая морфология (по ж. Серра)
- •Морфологические операции на бинарных изображениях
- •Морфологические операции на полутоновых изображениях
- •Морфологическое выделение «черт» и объектов
- •Морфологический спектр
- •Морфологические скелеты. Непрерывная бинарная морфология Непрерывная бинарная морфология
- •Непрерывное гранично-скелетное представление изображения
- •Обработка и использование скелета
- •*Обобщенные скелетные представления бинарных фигур
- •Алгоритмы утончения дискретного бинарного изображения
- •*Регуляризация скелетов
- •Типы нерегулярностей скелета
- •Устранение нерегулярностей
- •Регуляризация скелета по Тихонову
- •*Селективные морфологии
- •Метод оптических потоков
- •Дифференциальный подход
- •Корреляционный подход
- •Частотный подход
- •Корреляционное слежение.
- •Форматы хранения и передачи цифровых изображений
- •Методы сжатия цифровых изображений
- •Формат bmp
- •Формат pcx
- •Формат gif
- •Формат tiff
- •Формат jpeg
- •Форматы хранения и передачи цифровых видеопоследовательностей
- •Формат avi
- •Формат mpeg
- •Форматы mpeg 1 и mpeg 2
- •Формат mpeg 4
- •Форматы mpeg 7
- •Раздел 2. Распознавание образов.
- •Обучение с учителем. Детерминированные методы, основанные на «близости». Линейные решающие правила. Метод построения эталонов. Метод ближайшего соседа. Метод k ближайших соседей.
- •Линейные решающие правила
- •Метод построения эталонов
- •Методы ближайших соседей
- •Параметрические и непараметрические методы
- •Дискриминантные и моделирующие методы обучения
- •Способность распознавателя к обобщению. Регуляризация.
- •Байесовская теория решений. Случай двух классов. Классификаторы, разделяющие функции и поверхности решений. Вероятности ошибок. Разделяющие функции для случая нормальной плотности.
- •Дискриминантный анализ. Линейный дискриминант Фишера. Персептронная функция критерия. Линейный дискриминантный анализ (lda, дискриминант Фишера)
- •Персептрон Розенблатта
- •Байесовское объединение свидетельств
- •Структурное распознавание
- •Автоматизированное конструирование алгоритмов обнаружения объектов на основе преобразований модельных описаний объектов.
- •Нейросетевое распознавание
- •Нейронные сети ассоциативной памяти. Сети Хопфилда.
- •Многослойные персептроны. Оптимизационное обучение. Метод обратного распространения ошибки.
- •Многослойные персептроны. Правило Хебба.
- •*Связь с байесовским распознаванием
- •Сети встречного распространения. Самоорганизующиеся сети.
Форматы хранения и передачи цифровых видеопоследовательностей
Для хранения и передачи последовательностей цифровых изображений используются либо последовательности файлов изображений стандартных форматов (BMP, GIF, JPEG), либо специальные форматы хранения видеоданных, в которых последовательные кадры кодируются специальным образом, отличным от кодирования статических кадров.
Системы, сохраняющие последовательность кадров как последовательность (папку, директорию) обычных статических изображений обладают тем очевидным преимуществом, что полученные изображения могут быть легко прочитаны, загружены и проанализированы любым из стандартных пакетов для работы с изображениями. Однако существует и ряд причин, делающих такой способ хранения и передачи менее предпочтительным по сравнению с использованием специализированных форматов цифровых видеоданных.
1) Избыточность 1. Каждое изображение последовательности хранится вместе с собственным заголовком, содержащим тип, размеры, палитру и т.п. При небольшом размере изображения (например, 160х120 или 320х200) служебная информация может занимать до 10% объема файла. Между тем, очевидно, что для всех кадров видеопоследовательности этот заголовок можно было бы записать всего лишь один раз и дальше хранить только сами растровые данные.
2) Избыточность 2. Известно, что в медленно меняющихся сценах разность любых двух последовательных кадров содержит значительно меньше информации, чем сам исходный кадр. Следовательно, применение разностных схем сжатия видеоданных, учитывающих их последовательное расположение кадров, позволяет достичь существенно больших степеней сжатия видеопотока, чем раздельное сжатие каждого кадра. Это особенно принципиально в задачах передачи цифровых видеоданных.
3) Существуют дополнительные (например, временные) параметры видеосъемки, которые не сводятся только к параметрам каждого из изображений. Следовательно, для видеопоследовательности в целом все равно приходится хранить некий специальный заголовок – в виде отдельного файла, либо в виде заголовка единого файла видеопоследовательности, записанной в специальном формате.
4) В мультимедийных приложениях (запись видеофильмов, клипов и т.п.), помимо хранения видеоданных требуется также осуществлять и параллельную синхронную запись звуковых дорожек, а иногда и некоторых дополнительных данных – текстовых и цифровых меток и т.п. Все это требует создания специальных единых форматов для хранения и передачи разнородных цифровых данных, имеющих временную протяженность. На первый взгляд может показаться, что это чисто мультимедийное требование, которое не может встретиться в системах технического зрения. Однако, как мы уже говорили ранее, комплексирование данных, приходящих из самых разных источников – одна из основных тенденций в современных информационно-управляющих системах. В практической производственной задаче нам вполне может понадобиться осуществлять параллельную запись не только изображений от нескольких камер, но также и от нескольких микрофонов, нескольких электрических, тензометрических, акустических и т.п. датчиков. Весь этот массив информации крайне неудобно затем анализировать, если запись ведется в разные никак не связанные друг с другом файлы.
Исходя из приведенных соображений для записи, хранения и передачи цифровых видеоданных был создан ряд специальных файловых форматов. Наиболее распространенными из них на сегодня являются формат AVI и формат MPEG.