32. Стохастические грамматики и языки (привести пример).

Для методов синтаксического распознавания в случае работы со случайными величинами привлекаются статистические понятия и алгоритмы. В распознавании образов случайность появляется в основном в результате воздействия двух факторов – шума, возникающего при измерении характеристик объекта и неполноты информации о характеристиках классов образов.

Для получения статистического аппарата, используемые в ходе решения задач распознавания выполняется обобщение модели формальной грамматики на случай статистического характера. Для этого будем считать недетерминированными правила подстановки и ставить в соответствие каждому из них какую то вероятностную меру

G = <Vn, Vt, P, S, Q>

где все ее составляющие определяются по-прежнему, а Q – это множество вероятностных мер, заданных на множестве правил подстановки P.

Рассмотрим процесс порождения терминальной цепочки х, начинающейся с S: где ( представляют любые m правил подстановки из множества P и - промежуточные цепочки. Пусть различные правила подстановки применяются с вероятностями p( Тогда вероятность порождения цепочки x определяется как

где - условная вероятность, поставленная в соответствие правилу при предварительном применении правил .

Стохастическую грамматику называют неодназначной, если существует n различных путей порождения цепочек Х, характеризующихся вероятностями:

Т.о., вероятность порождения цепочки х неоднозначной стохастической грамматикой определяется как Множество Q совместно, если Стохастический язык L(G) – это язык, порожденный стохастической грамматикой G. Каждая терминальная цепочка х языка L(G) должна обладать вероятностью р(х) порождения данной цепочки. Стохастический язык, порожденный стохастической грамматикой G, формально можно определить так: где - множество всех терминальных цепочек, исключая пустую, порожденных грамматикой G;

Пример. Рассмотрим стохастическую грамматику G=(Vn,Vt, P,Q,S), где

Каждому правилу подстановки поставлена в соответствие вероятность его применения. Дважды применив первое правило, а затем один раз второе, получим последовательность S->aSb->aaSbb->aaabbb. Обозначив терминальную цепочку aaabbb через х и используя (1), имеем р(х)=(р)(р)(1-р)=р²(1-р). Язык, порожденный грамматикой G, задается в данном случае следующим образом:

Где каждая цепочку имеет связанную с ней вероятность. Эта стохастическая грамматика не является неоднозначной, так как существует всего одна последовательность правил подстановки, ведущая к каждой терминальной цепочке.

В стохастических языках используются те же методы грамматического разбора, что и в других грамматиках. Однако для облегчения процесса разбора могут привлекаться знания о вероятности применения правил подстановки. Предположим, например, что на определенном шаге процедуры восходящего грамматического разбора имеется несколько правил-кандидатов, одно из которых следует выбрать и применить. Очевидно, что для успешного разбора, следует начинать с того правила, которое имеет большую вероятность применения для порождения анализируемой терминальной цепочки. Вероятности применения грамматических правил должны использоваться в грамматическом разборе для увеличения скорости распознавания стохастических систем.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 2114 15 16 17 18 19 20 21 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.05.2015263.79 Кб1012Metrologia_shpory.docx
#
13.11.20192.46 Mб123met_2011.doc
#
11.05.20152.52 Mб132met_OAiP_1_2005.pdf
#
01.05.2025153.6 Кб1MET_UK_ME_21-10-AiPO_VS_12.doc
#
01.05.202560.8 Кб3MEТОДУКАЗАНИЯ-экономистам.docx
#
01.05.20254.98 Mб2Miapr_shporpak_RC1_post_Shpory.docx
#
20.08.2019104.45 Кб119Mikro 5.doc
#
20.08.2019388.61 Кб109Mikro 6.doc
#
01.07.2025141.94 Кб0mikroekonomika.docx
#
11.05.2015669.7 Кб390MINSKIJ_INSTITUT_UPRAVLENIYa (1).doc
#
01.07.20251.7 Mб0Miuf_1_laba_1_variant.doc