
- •1.Представление изображений в ис. Типы изображений, пикселы, разрешение, размер изображений, цветовые модели, форматы файлов.
- •2.Предварительная обработка изображений – точечные операции: соляризация, линейное контрастирование, препарирование, пороговая обработка.
- •3. Гистограммы и их преобразования (Преобразование гистограмм, эквализация).
- •4. Представление цвета в изображениях. Цветовые модели.
- •5. Линейные фильтры и свертки. Сглаживание через усреднение, сглаживание с помощью гауссиана.
- •6. Медианная фильтрация
- •7. Обнаружение границ. Градиент изображения, оператор Робертса, оператор Собела.
- •8. Методы сегментации изображений (зачем, как).
- •9. Машинный анализ и распознавание объектов. Выделение признаков. Типы признаков. Инвариантность признаков.
- •10. Распознавание изображений.
- •11. Методы сжатия изображений: классификация, метод rle, lzv.
- •12. Методы сжатия изображений: классификация метод Хаффмана.
- •13. Представление и сжатие изображений: пирамидальное представление, метод квадрантов, цепное кодирование.
- •15. Аппаратные средства мультимедиа технологий.
- •16. Кино и видео форматы изображения: форматы, принципы реализации.
9. Машинный анализ и распознавание объектов. Выделение признаков. Типы признаков. Инвариантность признаков.
Сравнение с эталоном. Проблема — большое количество эталонов, которые надо хранить, и медленная процедура поиска. Кроме того, невозможно учесть различие в положении, ориентации, размерах или расстояния до объекта, а также модификации формы объекта (человек стоит, сидит, бежит, и т.д.). Признаки. Основные методы в машинном зрении основаны на использовании признаков для обнаружения и опознания объектов. Для описания объектов используется набор признаков (x1, x2, …, xN). N — размерность пространства признаков. Признаком может служить, например: цвет, яркость, положение в пространстве, ориентация. Кластер-анализ. Кластер-анализ — автоматическое распределение множества объектов (-образцов) на классы. Классы определяются как компактные множества («облака») в пространстве признаков: два объекта относятся к одному и тому же классу, если представляющие их точки в пространстве признаков находятся рядом (в одном облаке). Кластер-анализ применяется не только в ИИ и не только для машинного зрения. Это универсальные алгоритмы, широко используемые для статистической обработки данных. В том числе и в ситуациях, когда «правильная» классификация объектов неизвестна. Цель — классификация образов (отнести образ к определенному классу). Основные подходы в кластер-анализе:
Статические алгоритмы.
Обучение (с учителем или без учителя).
Типы алгоритмов: Разделяющие гиперплоскости: для каждого класса в пространстве признаков строится гиперплоскость, отделяющая точки этого класса от остальных точек. Своеобразной реализацией этого алгоритма является персептрон. Метод комитетов: для разделения двух классов в пространстве признако строится совокупность гиперплоскостей. Для данной точки принадлежность ее к тому или иному классу определяется «большинством голосов» гиперплоскостей, входящих в комитет. Вычисление оценок (расстояние от заданной точки до кластеров в пространстве признаков). Основная проблема кластер-анализа: трудно выделить информативные признаки. Не по любому набору признаков можно правильно классифицировать объекты. Модели. Строится модель (=схема) объекта, описывающая основные составные части и соотношения признаков — вне зависимости от размеров, ориентации и конфигурации объекта. Пример: нет «треугольника вообще» (каждый треугольник либо прямоугольный, либо остроугольный, либо тупоугольный), «человека вообще» (мужчина/женщина, старик/ребенок и т.п.) Стратегия распознавания: строится гипотеза («Это дом»), которая затем проверяется на соответствие модели («крыша, стена, дверь, окна»).
Выделение признаков. Типы признаков. Инвариантность признаков.
Метрические
признаки, принимающие определенные
значения на некотором числовом
отрезке (площадь, средняя яркость и т.
д.);
логические
признаки, принимающие значения 1 или 0
(истинно или ложно данное утверждение
об изображении); примерами таких
утверждений служат: изображение имеет
«дыры», контур изображения неодносвязен,
форма изображения – прямоугольник,
площадь области изображения не больше
10;
топологические
признаки, как и логические, относятся
к качественному характеру изображения,
но могут принимать не два, а несколько
значений; примерами являются число
компонент связности контура изображения,
число дыр в связной области
объекта;
структурно-лингвистические
признаки связаны с двумя близкими
подходами к проблеме распознавания –
структурным и лингвистическим. При
структурном подходе изображение
считается состоящим из частей. Частями
изображения являются непроизводные
элементы, которые в совокупности с
правилами их соединения образуют
специальный язык (грамматику). Анализ
такой грамматики составляет суть
лингвистического подхода к
распознаванию. Грубо говоря,
структурно-лингвистические методы,
которые называют также синтаксическими,
направлены на синтаксическую формализацию
классов изображений: каждому классу
соответствует грамматика с определенными
правилами, каждому входному изображению
– фраза. Изображение считается
соответствующим данному классу, если
отвечающая ему фраза удовлетворяет
правилам грамматики для этого класса
изображений.
,
где
Е – область рассматриваемого изображения;
S(Е) – ее площадь; l(Е) – длина контура.
Очевидно, признак (E)
инвариантен к смещениям, к поворотам
и к изменениям масштаба. Метрические
признаки формы инвариантны к изменениям
яркости. В случае отсутствия
преобразований яркости или при известном
законе яркостных преобразований можно
использовать в качестве признаков
яркостные характеристики полутоновых
изображений. Основными яркостными
признаками являются:
средняя яркость в области изображения Вср;
максимальная и минимальная яркость Bmах, Bmin;
модальное значение яркости Bmod;
разброс (дисперсия) значений яркости