- •Распознавание образов. Общие положения.
- •Объекты в распознавании образов
- •Классификация объектов. Понятие расстояния между объектами.
- •Две группы методов распознавания и их особенности.
- •Разделяющая функция. Решающее правило. Пример разделения на два класса.
- •Линейные разделяющие функции для n классов. 1-ый случай разделения
- •Линейные разделяющие функции для n классов. 2-ой случай разделения
- •Обучение в решении задачи классификации
- •Обучение с учителем и без учителя
- •11. Алгоритм класс-ции на базе контролируемого обучения (к-средних)
- •12. Алгоритм классификации на базе самообучения (Максимин)
- •13. Расстояние между классами (частный случай)
- •14. Расстояние между списками
- •15. Метод динамического программирования
- •16. Классификация объектов вероятностным подходом. Закон Бейеса.
- •17. Решающее правило при вероятностном подходе.
- •18. Разделение объектов на два класса при вероятностном подходе
- •19. Устройство автоматической классификации «Персептрон»
- •20. Критерий коррекции весовых коэф-в для классификации объектов
- •21. Алгоритм классификации объектов на n классов (Персептрон)
- •22. Метод потенциалов
- •23. Иерархическое группирование
- •24. Определение иерархии
- •25. Пример метода иерархической классификации
- •26. Постановка задачи синтаксического распознавания образов. Структурная схема системы распознавания. (V)
- •27. Понятия языка, строки, грамматики. Описание грамматики и ее компонентов.
- •28. Связь между автоматами и грамматиками при синтаксическом распознавании. (V)
- •29. Постановка задачи синтаксического распознавания образов. Грамматический разбор сверху вниз (привести пример) (V)
- •30. Постановка задачи синтаксического распознавания образов. Грамматический разбор снизу вверх (привести пример). (V)
- •31. Применение методов синтаксического распознавания для двумерных объектов. Использование языка описания изображений pdl (привести пример). (V)
- •32. Стохастические грамматики и языки (привести пример).
- •33. Алгоритм вывода цепочечных грамматик. (V)
- •3 Части построения Алгоритма:
- •34. Алгоритм вывода двумерных грамматик.(V)
- •35. Общие понятия систем распознавания
- •36. Проблематика задач создания систем распознавания
- •37. Формулировка задач создания систем распознавания и методы их решения. Задачи 1,2
- •38. Формулировка задач создания ср и их решение. Задачи 3,4
- •39. Формулировка задач создания ср и их решение. Задачи 5,6
- •40. Принципы классификации ср (1, 2)
- •Однородность информации для описания распознаваемых объектов и явлений
- •Способ получения апостериорной информации
- •41. Принципы классификации ср (3, 4)
- •Количество первоначальной априорной информации
- •Характер информации признаках распознавания
- •42. Обучающиеся и самообучающиеся ср (структурные схемы)
- •43. Биологические основы функционирования нейрона
- •44. Принципы построения и действия искусственной нейронной сети
- •45. Инс в виде многослойного персептрона
- •46. Решение задач с помощью нс на базе многослойного персептрона
32. Стохастические грамматики и языки (привести пример).
Для методов синтаксического распознавания в случае работы со случайными величинами привлекаются статистические понятия и алгоритмы. В распознавании образов случайность появляется в основном в результате воздействия двух факторов – шума, возникающего при измерении характеристик объекта и неполноты информации о характеристиках классов образов.
Для получения статистического аппарата, используемые в ходе решения задач распознавания выполняется обобщение модели формальной грамматики на случай статистического характера. Для этого будем считать недетерминированными правила подстановки и ставить в соответствие каждому из них какую то вероятностную меру
G = <Vn, Vt, P, S, Q>
где все ее составляющие определяются по-прежнему, а Q – это множество вероятностных мер, заданных на множестве правил подстановки P.
Рассмотрим
процесс порождения терминальной цепочки
х,
начинающейся с S:
где (
представляют любые m
правил подстановки из множества P
и
- промежуточные цепочки. Пусть различные
правила подстановки применяются с
вероятностями p(
Тогда вероятность порождения цепочки
x
определяется как
где
- условная вероятность, поставленная в
соответствие правилу
при предварительном применении правил
.
Стохастическую грамматику называют неодназначной, если существует n различных путей порождения цепочек Х, характеризующихся вероятностями:
Т.о., вероятность порождения
цепочки х
неоднозначной стохастической грамматикой
определяется как
Множество Q
совместно, если
Стохастический язык L(G)
– это язык, порожденный стохастической
грамматикой G.
Каждая терминальная цепочка х
языка L(G)
должна обладать вероятностью р(х)
порождения данной цепочки. Стохастический
язык, порожденный стохастической
грамматикой G,
формально можно определить так:
где
- множество всех терминальных цепочек,
исключая пустую, порожденных грамматикой
G;
Пример.
Рассмотрим стохастическую грамматику
G=(Vn,Vt,
P,Q,S),
где
Каждому правилу подстановки поставлена в соответствие вероятность его применения. Дважды применив первое правило, а затем один раз второе, получим последовательность S->aSb->aaSbb->aaabbb. Обозначив терминальную цепочку aaabbb через х и используя (1), имеем р(х)=(р)(р)(1-р)=р2(1-р). Язык, порожденный грамматикой G, задается в данном случае следующим образом:
Где каждая цепочку имеет
связанную с ней вероятность. Эта
стохастическая грамматика не является
неоднозначной, так как существует всего
одна последовательность правил
подстановки, ведущая к каждой терминальной
цепочке.
В стохастических языках используются те же методы грамматического разбора, что и в других грамматиках. Однако для облегчения процесса разбора могут привлекаться знания о вероятности применения правил подстановки. Предположим, например, что на определенном шаге процедуры восходящего грамматического разбора имеется несколько правил-кандидатов, одно из которых следует выбрать и применить. Очевидно, что для успешного разбора, следует начинать с того правила, которое имеет большую вероятность применения для порождения анализируемой терминальной цепочки. Вероятности применения грамматических правил должны использоваться в грамматическом разборе для увеличения скорости распознавания стохастических систем.
