
- •Распознавание образов. Общие положения.
- •Объекты в распознавании образов
- •Классификация объектов. Понятие расстояния между объектами.
- •Две группы методов распознавания и их особенности.
- •Разделяющая функция. Решающее правило. Пример разделения на два класса.
- •Линейные разделяющие функции для n классов. 1-ый случай разделения
- •Линейные разделяющие функции для n классов. 2-ой случай разделения
- •Обучение в решении задачи классификации
- •Обучение с учителем и без учителя
- •11. Алгоритм класс-ции на базе контролируемого обучения (к-средних)
- •12. Алгоритм классификации на базе самообучения (Максимин)
- •13. Расстояние между классами (частный случай)
- •14. Расстояние между списками
- •15. Метод динамического программирования
- •16. Классификация объектов вероятностным подходом. Закон Бейеса.
- •17. Решающее правило при вероятностном подходе.
- •18. Разделение объектов на два класса при вероятностном подходе
- •19. Устройство автоматической классификации «Персептрон»
- •20. Критерий коррекции весовых коэф-в для классификации объектов
- •21. Алгоритм классификации объектов на n классов (Персептрон)
- •22. Метод потенциалов
- •23. Иерархическое группирование
- •24. Определение иерархии
- •25. Пример метода иерархической классификации
- •26. Постановка задачи синтаксического распознавания образов. Структурная схема системы распознавания. (V)
- •27. Понятия языка, строки, грамматики. Описание грамматики и ее компонентов.
- •28. Связь между автоматами и грамматиками при синтаксическом распознавании. (V)
- •29. Постановка задачи синтаксического распознавания образов. Грамматический разбор сверху вниз (привести пример) (V)
- •30. Постановка задачи синтаксического распознавания образов. Грамматический разбор снизу вверх (привести пример). (V)
- •31. Применение методов синтаксического распознавания для двумерных объектов. Использование языка описания изображений pdl (привести пример). (V)
- •32. Стохастические грамматики и языки (привести пример).
- •33. Алгоритм вывода цепочечных грамматик. (V)
- •3 Части построения Алгоритма:
- •34. Алгоритм вывода двумерных грамматик.(V)
- •35. Общие понятия систем распознавания
- •36. Проблематика задач создания систем распознавания
- •37. Формулировка задач создания систем распознавания и методы их решения. Задачи 1,2
- •38. Формулировка задач создания ср и их решение. Задачи 3,4
- •39. Формулировка задач создания ср и их решение. Задачи 5,6
- •40. Принципы классификации ср (1, 2)
- •Однородность информации для описания распознаваемых объектов и явлений
- •Способ получения апостериорной информации
- •41. Принципы классификации ср (3, 4)
- •Количество первоначальной априорной информации
- •Характер информации признаках распознавания
- •42. Обучающиеся и самообучающиеся ср (структурные схемы)
- •43. Биологические основы функционирования нейрона
- •44. Принципы построения и действия искусственной нейронной сети
- •45. Инс в виде многослойного персептрона
- •46. Решение задач с помощью нс на базе многослойного персептрона
29. Постановка задачи синтаксического распознавания образов. Грамматический разбор сверху вниз (привести пример) (V)
Структура порождается следующей последовательностью грамматических правил:
1. Правило заменяет начальный символ терминальным элементом а1, расположенным над некоторым, пока еще не определенным объектом О2
2. Заменяет неопределенный объект О2 неопределенным объектом О1, расположенным над горизонтальным отрезком а1.
3. О1 заменяется на два вертикальных терминальных элемента
Приведенные грамматики порождаются только однотипной структурой типа квадратов. Этот грамматический разбор представляет собой тривиальную процедуру, т.к. используется только одна последовательность правил подстановки.
30. Постановка задачи синтаксического распознавания образов. Грамматический разбор снизу вверх (привести пример). (V)
Рассмотрим
выполнение вышеизложенных грамматических
разборов на примере грамматики,
порождающей геометрические
фигуры типа квадратов. Грамматика
задается набором
при
Терминальными элементами служат горизонтальный и вертикальный отрезки определенной длины, обозначенные а1 и а2 .
Высказывания
A(x,y)«х расположен
над у»
и L(x,y) «х расположен
слева от у».
Это
правило заменяет начальный символ
терминальным элементом а1,
расположенным над некоторым неопределенным
объектом а2.
заменяет
нетерминальный объект О2 неопределенным
объектом О1, расположенным над
горизонтальным отрезком а1.
О1
заменяется на два вертикальных
терминальных элемента.
Разбор снизу вверх
1. Ищем О1 и определяем содержит ли он один терминальный элемент слева от другого. if (ok) continue else break
2. Получаем О2, сост. из О1, расположенного над терминальным элементом а1. Если успешно, пытаемся вывести S, отыскивая а1над О2. Если S может быть выведен, то образ принимается, т.е. он распознан, иначе нет.
31. Применение методов синтаксического распознавания для двумерных объектов. Использование языка описания изображений pdl (привести пример). (V)
Вышеизложенный грамматический разбор представляет собой тривиальную процедуру, так как в ней используется только одна последовательность правил подстановки. Данный недостаток алгоритмов, реализованных на основе деревьев, исправляется с помощью объектов, сводимых к структурам типа графов.
Интересным приложением лингвистических понятий в распознавании образов является язык PDL (Picture Description Language) – язык описания изображений. Терминальным элементом PDL служит любая n-мерная структура с двумя выделенными точками: хвостовой и головной.
По правилам языка PDL практически любая структура может обобщенно рассматриваться как ориентированный отрезок прямой, так как определение вводит для нее только две точки. Терминальные элементы связываются между собой только в хвостовых и (или) головных точках. Следовательно, структуры языка PDL представляют собой ориентированные графы, и для их обработки можно использовать грамматики. На рис. 8.2 показаны типичные правила соединения терминалов языка PDL.
Кроме использования языка PDL, грамматику можно расширить путем введения в ее правила подстановки рекурсивности, когда переменная способна замещаться этой же переменной. Однако увеличение порождающей способности грамматики не всегда желательно. Особенно это касается тех исследований, где используется более одной грамматики. В этом случае чрезмерное их многообразие приводит к уменьшению различающей мощности каждой из грамматик.
Рис. 8.2 – Правила соединения терминалов
Рассмотрим практический пример синтаксического распознавания образов, в котором выполняется автоматическая классификация телоцентрических и V-образных хромосом. Классифицирующая грамматика имеет следующий вид:
={a,
b,
c,
d,
e};
={S,
T,
Основание, Сторона, Пара плеч, Правая
часть, Левая часть, Плечо}.
На
рис. 8.3 изображены терминальные элементы
хромосом {a,b,c,d,e},
на рис. 8.4 – типичный вид телоцентрической
и V-образной
хромосом. Оператор «
»,
используемый при построении правил
грамматики, означает связность отдельных
частей хромосомы, фиксируемую при
продвижении вдоль ее границы по
направлению часовой стрелки.
Рис. 8.3 – Терминальные элементы хромосом
Рис. 8.4 – Телоцентрическая и V-образная хромосомы
P: S
T Основание Пара плеч, Пара плеч Сторона Пара плеч, Пара плеч Пара плеч Сторона, Пара плеч Плечо Правая часть, Пара плеч Левая часть Плечо, Левая часть Плечо с, Правая часть с Плечо,
|
Основание b Основание, Основание Основание b, Основание е, Сторона b Сторона, Сторона Сторона b, Сторона b, Сторона d, Плечо b Плечо, Плечо Плечо b, Плечо а. |
Начальные символы S и T представляют телоцентрические и V-образные хромосомы. Для разделения на два класса используется одна грамматика с двумя начальными символами. Если грамматический разбор снизу приводит к начальному символу Т, хромосому относят в класс V-образных. Если же разбор приводит к S, хромосома классифицируется как телоцентрическая. В силу схожести поставленных задач целесообразно их решать в рамках одной грамматики. На рис. 8.5 приведено дерево, отражающее порядок разбора предложения.
Рис. 8.5 – Восходящий грамматический разбор хромосомы
В качестве первого шага на пути распознавания заданного цифрового изображения хромосомы необходимо найти точку на границе хромосомы и затем осуществлять продвижение вдоль границы по направлению часовой стрелки. По мере продвижения система процедур распознавания обеспечит обнаружение терминальных элементов {a,b,c,d,e}. В результате такого отслеживания границы хромосома оказывается эффективно сведенной к цепочке терминальных элементов и образует терминальное предложение, как показано на рис. 8.4. После сведения хромосомы к терминальному предложению начинается его синтаксическое распознавание. Рассмотрим предложение для телоцентрической хромосомы и применим к нему разбор снизу вверх. Будет происходить обратный порядок применения правил подстановки, начиная с правила Плечо а.
Рассмотрим алгоритм проверки классификации хромосомы.
1-й шаг. Анализатор находит а и выдает нетерминал Плечо. Символ а находится 4 раза, что приводит к появлению четырех нетерминалов Плечо на первом уровне поиска, считая снизу.
2-й шаг. Сочетание Плечо с терминалом b.
3-й шаг. Порождение Плеч.
4-й шаг. Порождение нетерминала Сторона при помощи символов d и b.
5-й шаг. Комбинация Плеча и с порождает Правую часть.
6-й шаг. Правая часть и Плечо порождают Пару плеч.
7-й шаг. Пара Плеч и Сторона порождают два символа Пара Плеч.
8-й шаг. Объединение двух Пара Плеч в S.
Поскольку за конечное число шагов алгоритм закончился на символе S, хромосома была правильно классифицирована как телоцентрическая.
Предложенный грамматический разбор привел к искомому результату при первой реализации. Так получается далеко не всегда, поскольку обычно приходится выполнять частые возвраты. Однако их число можно минимизировать введением в процесс поиска эвристических правил, указывающих грамматическому анализатору способ действия в ситуациях, когда возможны несколько вариантов продолжения.