
- •1.Представление изображений в ис. Типы изображений, пикселы, разрешение, размер изображений, цветовые модели, форматы файлов.
- •2.Предварительная обработка изображений – точечные операции: соляризация, линейное контрастирование, препарирование, пороговая обработка.
- •3. Гистограммы и их преобразования (Преобразование гистограмм, эквализация).
- •4. Представление цвета в изображениях. Цветовые модели.
- •5. Линейные фильтры и свертки. Сглаживание через усреднение, сглаживание с помощью гауссиана.
- •6. Медианная фильтрация
- •7. Обнаружение границ. Градиент изображения, оператор Робертса, оператор Собела.
- •8. Методы сегментации изображений (зачем, как).
- •9. Машинный анализ и распознавание объектов. Выделение признаков. Типы признаков. Инвариантность признаков.
- •10. Распознавание изображений.
- •11. Методы сжатия изображений: классификация, метод rle, lzv.
- •12. Методы сжатия изображений: классификация метод Хаффмана.
- •13. Представление и сжатие изображений: пирамидальное представление, метод квадрантов, цепное кодирование.
- •15. Аппаратные средства мультимедиа технологий.
- •16. Кино и видео форматы изображения: форматы, принципы реализации.
10. Распознавание изображений.
При создании систем технического зрения (СТЗ) возникает ряд трудностей и проблем:
Изображения предъявляются на сложном фоне.
Изображения эталона и входные изображения отличаются положением в поле зрения.
Входные изображения не совпадают с эталонами за счет случайных помех.
Отличия входных и эталонных изображений возникает за счет изменения освещенности, подсветки, локальных помех.
Эталоны и изображения могут отличать геометрические преобразования, включая такие сложные как аффинные и проективные.
Для
решения задачи в целом и на отдельных
ее этапах применяются различные
методы.
Классификацию
основных методов обработки и распознавания
СТЗ изображений приведены на схеме, где
указаны основные процедуры и методы
обработки от начального этапа восприятия
поля зрения посредством датчиков,
например, телекамеры до конечного,
которым является распознавание.
^ Основные
процедуры и методы распознавания
изображений
Операция
предобработки применяется практически
всегда после снятия информации с
видеодатчика и преследует цель снижения
помех на изображении, возникших в
результате дискретизации и квантования,
а также подавления внешних шумов. Как
правило, это операции усреднения и
выравнивания гистограмм.
Сегментация
обычно понимается как процесс поиска
однородных областей на изображении.
Этот этап весьма трудный и в общем виде
не алгоритмизированный до конца для
произвольных изображений. Наиболее
распространены методы сегментации,
основанные на определении однородных
яркостей (цветов) или однородностей
типа текстур.
После
сегментации возникают помехи в виде
как разрозненных изменений изолированных
элементов изображения, так и в виде
искажений некоторых связных областей.
На практике при борьбе с подобными
помехами наибольшее распространение
получили цифровые фильтры-маски и
нелинейные фильтры типа медианных. При
этом в случае сегментации путем выделения
границ использование усредняющих
фильтров-масок невозможно, так как
границы при этом не подчеркиваются, а
размываются. Для подчеркивания контуров
применяются специальные операторы
интегрального типа.
Распознавание
- чаще всего конечный этап обработки,
лежащий в основе процессов интерпретации
и понимания. Входными для распознавания
являются изображения, выделенные в
результате сегментации и, частично,
отреставрированные. Они отличаются от
эталонных геометрическими и яркостными
искажениями, а также сохранившимися
шумами.
Для
реальных задач распознавания применяются,
в основном, четыре подхода, использующие
методы: корреляционные, основанные на
принятии решений по критерию близости
с эталонами; признаковые и синтаксические
- наименее трудоемкие и нормализации,
занимающие промежуточное положение по
объему вычислений.
Каждый
из подходов в распознавании имеет право
на существование. Более того, в рамках
каждого подхода есть свои конкретные
алгоритмы, имеющие определенную область
применения, которая зависит от характера
различий входных и эталонных изображений,
от помеховой обстановки в поле зрения,
требований к объемам вычислений и
скорости принятия решений.