Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Intellektualnye_informatsionnye_sistemy_Palama.doc
Скачиваний:
4
Добавлен:
01.03.2025
Размер:
325.12 Кб
Скачать

Моделирование зрения.

Зрение связано не только с анализом визуальной информации, но и с мыслительной деятельностью по её обработке. Выделяют следующие проблемы при разработке и моделирование таких систем:

  1. Поскольку не существует знаний о механизме зрительного восприятия, то система моделирует реакции системы, а не её структуру.

  2. Для моделирования мыслительной деятельности необходимо использовать системы представления знаний.

Особенности зрительного восприятия человека.

Человек имеет тенденцию группировать зрительные образы в простые понятия и выполняет узнавание визуальных образов. Особенности:

  1. Проблемная ориентация зрения. Зрение человека постоянно подстраивается под контекст восприятия. Это означает, что система, несмотря на свою универсальность, является проблемно-ориентированной в каждый момент времени и возможные реакции на ситуацию ограничены. Сознание достраивает не только форму, но и пространственные характеристики, то есть глубину. Гельштатп – раздел психологии, где изучается экспериментальная эстетика, которая позволяет определить восприятие образа из структурных элементов в узнаваемую сущность.

  2. Глобальность и локальность зрения, в нейрофизиологических моделей опознавание объекта описывается как последовательное объединение более сложной информации о частных признаках объектах. То, что глаз чувствителен к низким частотам на изображение и это используется в алгоритмах сжатие изображения. Например, в jpeg – квадрат восемь на восемь пикселов. Пережимает RGB в I (яркость)Cr(хроматический красный)Cb (хроматический синий). Затем преобразование алгоритмом сжатия и делится на низкочастнотную область и высокочастотную, которую срезают. Поскольку зрение более чувствительно к яркости, чем к цвету, это позволяет сжимать цветовые компоненты с большими потерями.

  3. Множественность форм видения. Человек узнает один и тот же образ при различном освещении, повороте объекта и различных искажениях размера, цветности и тд. Существует две гипотезы данного явления:

    • Человек соотносит наблюдаемый образ с эталонным путём компенсации различных искажений.

    • Человек воспринимает по относительным характеристикам, которые инвариантны к определённого вида искажениям (например, площадь инвариантна к повороту).

  4. Межполушарная ассиметрия. Левое полушарие связано со зрительными обучением и образным мышлением. А правое связано с логическим анализом информации (предметное мышление, вербальный анализ информации).

Методы обработки изображений.

Изображение – это числовая матрица, f (i,j), i – строки изображения, j – столбцы. В зависимости от представления в файле различают палитровый и непалитровый режим. В непалитровом каждый пиксель – это RGB представление цвета. В палитровом режиме это число, являющееся индексом в массиве (палитре) цветов.

С точки зрения обработки изображения различают следующие классы изображений:

  1. Полутоновое и цветное.

  2. Бинарное (черно-белое).

  3. Кривые.

  4. Точки и многоугольники.

Методы обработки могут переводить изображения из одного класса в другой и могут оставлять изображения в пределах класса.

Сегментация изображений подразумевает выделение на изображении частей, которые поддаются единому описанию в пространстве признаков. Сегментация может быть следующих видов:

  1. Яркость.

  2. Контур.

  3. Сегментация по текстуре.

  4. Семантическая (смысловая).

Сегментация по яркости выполняется методом пороговой обработки изображений. Для определения величины порога используется гистограмма яркости.

Если при обработке использовать несколько порогов, то изображение остаётся в рамках первого класса, но уменьшенное количество уровней яркости позволяет анализировать смысловые области на изображении.

Операции утончения позволяют получить остов изображения, который затем может быть описан графом.

Операция отслеживания контура обеспечивает отображение области в кривую.

Расширение контура – это восстановление области на основе остова.

Заполнение – это операция заливки контура для получения области.

Сегментация кривых – это операция выделения на контуре особых точек, которые позволяют выделить его характерные особенности (например, концевые точки, точки перегиба, точки ветвления).

Интерполирование и аппроксимация позволяют получить по набору точке кривые.

На изображении могут присутствовать шумы, для устранения которых могут использоваться следующие операторы:

  1. Фильтр средних значений. Изображение обрабатывается с помощью окна 3х3 пикселя и яркость центрального элемента в точки i, j заменяется средним значением элементов окна: f(i, j) = 1/9 * ∑ f (i+x, j+y). Такой фильтр позволяет устранить шумы на изображении в виде одиночных точек и неоднородность яркости объекта. Недостатком данного фильтра является размывание границ на изображении.

  2. Медианный фильтр. Здесь для элементов окна строится кривая вероятностного распределения яркости. Затем находится положение медианы. Медиана определяет, что S1 = S2. И яркость центрального элемента окна заменяется на значение медианы. Данный фильтр сохраняет границы объектов, но может искажать форму.

Для сегментации текстурных изображений используется метод анализа матрицы совместной встречаемости уровней серого на изображении.

Элементом данной матрицы является величина Pr,n(i,j) – частота, с которой пиксели с яркостями i и j, отстоящие на расстоянии r (расстояние между элементами с одинаковой яркостью) в направлении n (в градусах от центра квадрата 3х3 пикселя) встречаются на изображении.

Частоты, усреднённые по всем направлениям, заполняют матрицу, и диагональные элементы данной матрицы определяют пороги для сегментации.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]