
Алгоритмы выделения контуров.
Контур – это перепад функции яркости. Для выделения контура на изображении необходимо продифференцировать функцию яркости. Непрерывные производные аппроксимируются для дискретной функции с помощью конечных разностей:
df/dx (i,j)= f (i+1,j)-f (i,j);
df/dx (i,j)=f (i,j+1)-f (i,j);
Поскольку для вычисления производной используются соседние пиксели, то результат дифференцирования является смещенным на половину пикселей. Для устранения данного недостатка используются центральные разности, где рассматриваются разности в окне 3х3 пикселя. При увеличении размера окна снижается чувствительность оператора к шуму. Например, оператор превитта, пример горизонтального выделения перепада яркости.
Для усиления выделения контура используются операторы, аппроксимирующие вторую производную производную функции яркости – оператор Лапласа.
Алгоритмы утончения.
Целью утончения является формирование связной линии шириной в один пиксель. Пиксели контура должны быть либо четырехзсвязными либо восьмисвязными.
В процессе утончения последовательно удаляются пиксели, сохраняющие связность контура. На результат утончения влияют пустоты и бахрома – эти элементы могут явится источником возникновения ложных контуров.
Рассмотрим вариант утончения сверху.
Функция, определяющая является ли пиксель p крайним сверху: gв = не 2 & 7.
Затем рассчитывается функция fв = (не 1 & не 5) или (не 3 & 4) или (4 & 5) , которая учитывает взаимное положение элементов, соседних с пикселем p.
Если для пикселя p функция φв = gв Х (конъюнкция) fв = 1, то пиксель p можно удалить. Аналогично выполняется удаление крайних снизу, крайних слева и крайних справа пикселей.
Методы распознавания образов.
Свойства мозга, позволяющие сформировать понятие класса по нескольким представителям связано с существованием понятия образа. Свойства:
Объективность существования образа.
Ознакомление с конечным числом представителей позволяет узнавать большое количество различных реализаций образа.
Объект, претерпевая некоторые искажения, продолжает оставаться в пределах одного класса. В результате границы класса могут расплывчатыми.
Для визуального образа причинами изменчивости могут быть:
Изменчивость геометрии системы «наблюдатель - объект».
Изменчивость поверхности объекта (различные материалы или окраска поверхности).
Изменчивость освещенности.
Изображение может быть восстановлено в предположении, что сохраняется топология пространства, т.е. в определённой точке поверхность не рвётся и точка со всей её окрестностью проецируется в такую же точку при сохранении окрестности всей.
Основные этапы развития теории распознавания образов.
1959 год. Были выявлены 4 типа нейронных структур, реагирующих на определённые изображения на сетчатке глаза лягушки:
Детектор края.
Детектор движущегося края.
Детектор затемнения.
Детектор движущегося маленького объекта.
1974 год. Изучение мозга. Было определено, что зрительное поле сетчатки млекопитающих проецируется на зрительные отделы коры головного мозга. У человека были выделены нейронные структуры, обнаруживающие прямые линии определённого направления, углы, линии определённой длины. Несколько позднее были описаны нейроны, реагирующие на решётки определённой частоты, и была выдвинута гипотеза о голографическом принципе запоминания видеоинформации.
1965 – 1975. Перцептрон Розенблата. Основная идея для распознавания в перцептроне это преобразование пространства первичных признаков в пространство более абстрактных признаков.
с начала 70-х годов. Разработка алгоритмов распознавания сцен из набора объектов с плоскими гранями. Определение вида объектов и параметров их взаимного положения.
Основы семантической сети.
<…>
В семантической сети используется три вида объектов:
Понятия. Сведения об абстрактных или физических объектах предметной области. Понятие интерпретируется как множество доменов. Понятия определяют пространства состояний предметной области.
События. Это действия, которые могут внести изменения в пространство состояний предметной области. Для достижения целевого состояния может быть задана последовательность событий.
Свойства. Это элементы языка, используемые для уточнения понятий, событий и других свойств и снабжают объекты предметной области дополнительными характеристиками.
Помимо объектов существуют отношения, которые их связывают. Различают следующие виды отношений, которые могут использоваться в семантической сети:
Лингвистические. В соответствии с правилами языка из делят:
Падежные (агент – это отношение между событием и тем, кто или что его вызывает, объект – это отношение между событием и тем, над чем производится действие, условие – указывается логическая зависимость между событиями, место свершения события, время свершения события, адресат – объект, пользующийся результатом действия).
Характеризация глаголов – время, число, лицо, залог, наклонение.
Атрибутивные отношения. Определяют характеристики объектов (какой?).
Логические. Эти отношения служат для принятия решений и рассуждений. В простейшем случае используется алгебра логики (конъюнкция, дизъюнкция и тд).
Теоретико–множественные отношения. ISA – элемент множества, SUB – отношения (объединения, пересечения, вычитания множеств).
Квантифицированные отношения. Использование кванторов.
Пример: Если клиент оформил заказ и согласовал его со службой водоснабжения, то он должен выполнить предоплату. Если есть предоплата, то фирма начинает разработку проекта.
F1 – оформление.
F2 – согласование.
F3 – выполнить.
F4 – начинать.
F
Модель семантической сети работает в режиме ответа на запросы. В качестве запроса используется подграф, в котором в качестве переменных могут быть имя факта, вид отношения и понятия предметной области. Подграф запроса вкладывается в семантическую сеть путём перебора возможных вариантов. При изоморфном вложении, то есть при совпадении определенных элементов выполняется конкретизация переменных запросов. На основании этих значений переменных может строиться ответ на естественном языке.
Например, запрос почему фирма не начинает разработку?
Модель представления знаний на основе семантической сети:
Фреймовая модель.
Недостатком семантической сети является слишком произвольная структура, разнообразные типы вершин и связей, что требует различных процедур обработки информации, что усложняет программное обеспечение. Фреймовая модель имеет психологическое обоснование. Связана с понятием абстрактного образа. Понятие фрейма предложено в 1979 году ученым Минским, который используется для представления объекта или явления, обладающего следующим свойством: удаление из описания объекта любой его части приводит к потере свойств, характеризующих этот объект.
Фрейм – это абстрактный образ для представления некоторого стереотипа восприятия. Если понятия – это неформализованные знания о стереотипной ситуации, то фрейм – это формализованное понятие. Формирование понятий в формализованную ситуацию выполняются экспертом на основе опыта и знаний. Фрейм формально представляется как декларативно-процедурная структура, состоящая из следующих элементов.
F = {n(S1, d1, p1), (S2, d2, p2), ….}
n – имя фрейма.
S – имя слота.
d – значение слота.
p – процедура, связанная со способом получения данных слота.
Имена фреймов используются для создания сети фреймов. В модели представления знаний на основе фреймов используются следующие понятия:
Фреймы – образцы (фреймы - прототипы). Элементы базы знаний, хранящие интенсиональное представления.
Фреймы – экземпляры (примеры). Это элементы базы знаний, хранящие экстенсиональное представление знаний, то есть хранят реальные ситуации.
Значение слота может быть имя другого фрейма, что позволяет осуществить наследование фреймов и сетевое связывание.
Существует несколько способов получения значений во фрейме-экземпляре:
По умолчанию от фрейма – прототипа.
Через наследование свойств.
По формуле.
Через присоединённую процедуру.
Процедуры – демоны, которые активизируются каждый раз, когда данные попадают в слот либо удаляются из него.
Процедуры – слуги. Эти процедуры активизируются только по запросу.
Различают модели фреймов, которые адаптированы под определённые задачи:
Фреймы – структуры.
Фреймы – роли.
Фреймы – сценарии.
Фреймы – ситуации.