8.3. Постановка задачи синтаксического распознавания образов

Понятия, описанные в § 8.2, могут быть связаны с распознаванием следующим образом. Предположим, у нас имеются два класса образов ω₁ и ω₂ и пусть образы этих классов могут быть построены из признаков, принадлежащих некоторому конечному множеству. Назовем эти признаки треминалами и обозначим множество терминалов символом V_Т в соответствии с системой обозначений, введенной в § 8-2, В синтаксическом распознавании образов терминалы называются также непроизводными символами (элементами). Каждый образ может рассматриваться как цепочка или предложение, поскольку он составлен из терминалов множества V_Т. Допустим, что существует грамматика G, такая, что порождаемый ею язык состоит из предложений (образов), принадлежащих исключительно одному из классов, скажем ω₁ _. Очевидно, что эта грамматика может быть использована в целях классификации образов, так как заданный образ неизвестной природы может быть отнесен к ω₁, если он является предложением языка L{G}. В противном случае образ приписывается классу ω₂. Например, бесконтекстная грамматика G=(V_N, V_t, P, S) при V_N ={S }, V_t={a,Ь} и множестве правил подстановки Р= {S —> аaSb, S —> aab} обладает способностью порождать лишь предложения, содержащие вдвое больше символов а, чем Ь. Если мы сформулируем гипотетическую задачу разбиения образов нa два класса, причем объекты класса ω₁—это цепочки вида aab. aaaabb и т. д., а объекты класса ω₂ содержат одинаковое число символов а и Ь (т. e. аЬ. аaЬЬ и т. д.), то очевидно, что классификация заданной цепочки производится простым определением того, может ли данная цепочка порождаться грамматикой G, рассмотренной выше. Если может, то объект принадлежит ω₁ если нет — он автоматически приписывается классу ω₂. Процедура, используемая для определения, является или не является цепочка предложением, грамматически правильным для данного языка, называется грамматическим разбором. На способах грамматическокого разбора мы остановимся несколько позже.

По приведенной выше схеме классификации образ попадает в класс ω₂исключительно потому, что он не принадлежит классу ω₁. Если обнаружится, что образ не является правильным для G предложением, предполагается, что он должен принадлежать ω_2.Тем не менее не исключено, что образ не принадлежит и классу ω_2
.Он может представлять собой зашумленную или искаженную цепочку, которую лучше всего изъять из распознавания. Для того чтобы обеспечить возможность изъятия, необходимо задать две грамматики G₁ и G₂, порождающие языки L{ G₁} и L(G₂} соответственно. Образ зачисляется в класс, язык которого позволяет считать этот образ грамматически правильным предложением. Если обнаружится, что образ может принадлежать обоим классам, его произвольно зачисляют в любой из этих классов. Если он не является предложением ни L{ G₁}, ни L{ G₂}, образ изымается.

В случае М классов мы рассматриваем М грамматик и связанных с ними языков L(Gi}, i= I, 2, .., М. Распознаваемый объект относится к классу ω_i, в том и только том случае, если он является предложением языка L(Gi}. Если объект является предложением более чем одного языка или не принадлежит ни одному из них, он может быть изъят из рассмотрения или произвольно отнесен к одному из классов неопределенных объектов.

В связи с изложенным выше подходом к распознаванию возникает ряд существенных вопросов. 1) Как наилучшим образом описывать объекты для их классификации подобным способом? 2) Как выбираются грамматики распознавания? 3) Любая задача, имеющая практическое значение, обычно искажается случайными переменными, например шумами измерения: каким образом в синтаксическом подходе можно использовать статистический аппарат с тем, чтобы учесть эти случайные переменные? 4) Одной из наиболее важных особенностей рассмотренных ранее подходов к распознаванию образов является способность строить решающие функции посредством итеративных процедур обучения; можно ли распространить концепцию обучающей выборки на синтаксическое распознавание? Каждому из этих вопросов соответствует отдельный параграф.

<<< < Предыдущая 1 23 / 113 4 5 6 7 8 9 10 11 > Следующая >>>

Соседние файлы в папке lecture7

#
01.05.201435 б60readme
#
01.05.201473.22 Кб63short_lecture.doc
#
01.05.2014427.52 Кб71sintaks1.doc