Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Реферат - Лингвистические методы распознавания

.doc
Скачиваний:
31
Добавлен:
02.05.2014
Размер:
78.85 Кб
Скачать

Уфимский Государственный Авиационный

Технический Университет

Кафедра ТК

Реферат

На тему:

Лингвистические методы распознавания”

Уфа 2003

Содержание

Введение. 3

1. Грамматики и языки. 3

2. Деревья вывода 5

3. Деревья решений 5

4. Распознавание 6

5. Вывод грамматики. 7

6. Заключение. 7

Введение.

В лингвистическом методе распознавания признаками служат подобразы (непроизводственные элементы) и отношения между ними, характеризующие структуру образа. Для описания образов через непроизводственные элементы и их отношения используют “язык” образов. Правила такого “языка” называются грамматикой. Сам образ представляется предложением в соответствии с действующей грамматикой.

Для распознавания образа необходимо:

  1. Определить непроизводственные элементы и отношения между ними.

  2. Провести синтаксический анализ (грамматический разбор), чтобы установить согласуется ли описание образа с грамматикой, которая могла бы его породить.

Синтезировать грамматику можно, используя:

  • аппаратные сведения об образах

  • результаты анализа некоторого конечного множества репрезентативных образов (вывод грамматики).

Структурная схема лингвистической системы приведена на рисунке 1.

Рисунок 1. Структурная схема лингвистической системы

1. Грамматики и языки.

Грамматика образа может быть использована для порождения предложений, представляющих некоторый образ и для грамматического разбора предложений, цель которого состоит в определении соответствия их структуры применяемой грамматики.

Порождение предложения начинается с некоторого начального символа S, принадлежащего некоторому множеству вспомогательных символов Va. Правило, входящее в набор правил R некоторой грамматики, можно применить для преобразования начального символа S в некоторую цепочку символов, например S→aA; это означает, что символ S заменен символами аА. Некоторые символы, входящие в такую цепочку, могут принадлежать множеству вспомогательных символов Va, однако некоторые другие символы могут принадлежать множеству непроизводных элементов Vp. Эти элементы обозначим строчными буквами, а вспомогательные символы – заглавными. Вспомогательные символы, входящие в цепочку, полученную в результате преобразования, могут быть подвергнуты новому преобразованию в соответствии с правилами используемой грамматики и т.д. Если предложение содержит только непроизводные элементы, то оно считается построенным. Грамматики и типы правил определяются теорией, обладающей высокой степенью формализации.

Пример:

Заданны: непроизводные элементы а, b, c, d, так что Vp = {a, b, c, d}; вспомогательные символы VA = {S, A, B, C, D}; правила R={SaA, SbB, ScC, SdD, Ab, BC, Cd, Da}. Выведем четыре предложения (знак  обозначает вывод); SaAab; SbBbc; ScCcd; SdDda.

Если непроизводные элементы имеют вид, показанные на рисунке 2 (а), а цепочка представляет конкатенацию непроизводных элементов (головная часть присоединяется к хвостовой), то данная грамматика описывает четыре образа прямого угла, приведенного на рисунке 2 (б).

Рисунок 2. Образы

2. Деревья вывода

Вывод предложения представляют с помощью дерева вывода. На Рисунке 3 приведены деревья вывода для рассмотренного примера. Корнем дерева служит начальный символ S; выводимое предложение образует (слева направо) листья на концах ветви. Каждое дерево вывода порождает одно предложение. Большинство грамматик позволяет порождать большое (бесконечное) число предложений, поскольку допускается возможность выбора (определяемого, возможно, вероятностями).

Рисунок 3. Деревья вывода.

3. Деревья решений

Внешне эти деревья подобны деревьям вывода. В простейшем случае из каждой вершины “растут” две ветви; одна соответствует решению о наличии признака, другая – о его отсутствии.

Дерево решения показывает, какие признаки (в данном случае – какие непроизводные элементы и отношения между ними) присутствуют. Обычно процедуры, связанные с использованием деревьев решений относят к лингвистическому распознаванию.

На рисунке 4 представлен типичный пример дерева решений.

  • Вершина 1 определяет наличие или отсутствие вертикального непроизводного элемента.

  • Вершина 2а определяет наличие или отсутствие горизонтального непроизводного элемента справа от нижней части вертикального производного элемента.

  • Вершина 2b определяет наличие или отсутствие криволинейного непроизводного элемента.

  • Вершины 3 определяют наличие или отсутствие горизонтального непроизводного элемента справа от верхней части вертикального непроизводного элемента.

  • Вершины 4 определяют наличие или отсутствие горизонтального непроизводного элемента в середине вертикального непроизводного элемента.

Рисунок 4. Дерево решения.

4. Распознавание

Распознать изображение описываемое с помощью некоторой грамматики, означает определить является ли представление этого изображения через его непроизводные элементы и их отношения синтаксически правильными. Если образ не определяется с помощью этой грамматики, то он отклоняется или для его анализа должна использоваться другая грамматика.

При проведении грамматического разбора снизу вверх дерево вывода должно быть восстановлено, начиная с терминальных элементов, посредством применения грамматических правил в обратном порядке. Терминальный элемент а предложения ab (из примера) можно получить с помощью как правила D→а, так и правила S→aA; вспомогательный элемент D порождается правилом S→dD и, следовательно, не приводит к получению ab; поскольку S→aA в сочетании с А→b действительно позволяет получить предложение ab, последнее считается допустимым. Предложения ac и ad отклоняются.

При грамматическом разборе сверху вниз грамматические правила применяются в обычной последовательности, начиная с начального символа до тех пор, пока анализируемое предложение будет или не будет обнаружено. Если дерево решений представляет задачу, то распознавание предполагает проверку наличия или отсутствия некоторого признака в каждой вершине. Признаки используются последовательно в соответствии со структурой дерева, ответы получаемые в процессе этого опроса, определяют маршрут продвижения по дереву решений.

5. Вывод грамматики.

Задача заключается в отыскании (выводе) некоторой грамматики по некоторой конечной выборке предложений языка (положительные примеры), а иногда с учетом некоторого конечного числа предложений, не принадлежащих этому языку (отрицательные примеры).

Положительные примеры должны обладать структурной полнотой - все грамматические правила должны применяться при порождении хотя бы одного из этих выборочных предложений.

6. Заключение.

Выбор непроизводных элементов осуществляется на основе априорных сведений и интуиции; если не удается построить простое описание изображений, то может построиться смена непроизводных элементов на реальных изображениях.

Правила грамматики задаются обычно на основе априорных сведений. Вывод правил на основе выборки предложений (образов) возможен, но труден и используется в распознавании не часто.