8 Распознавание цепочек символов с помощью автоматов с магазинной памятью.

Магазинные автоматы, известные также как автоматы с магазинной памятью или как МП-автоматы, формально определяются следующим образом.

Определение. Конфигурацией МП-автомата P называется тройка (q, ω, α), гдеq – текущее состояние управляющего устройства, ω – неиспользованная часть входной цепочки (если ω=ε, то считается, что вся входная цепочка прочитана), α – содержимое магазина (самый левый символ цепочки α считается верхним символом магазина; если α=ε, то магазин считается пустым).

На каждом шаге работы МП-автомат может либо занести что-то в магазин, либо снять какие-то значения с его вершины. Отметим, что МП-автомат может продолжать работать в случае окончания входной цепочки, но не может продолжать работу в случае опустошения магазина.

9 Грамматики языков. Классификация языков по Хомскому.

Каждая конструкция, которая может быть описана регулярным выражением, может быть описана и грамматикой.

Каждый язык программирования имеет правила, которые предписывают синтаксическую структуру корректных программ. Синтаксис конструкций языка программирования может быть описан с помощью контекстно-свободных грамматик или нотации БНФ. Грамматика дает точную и при этом простую для понимания синтаксическую спецификацию языка программирования.

Для некоторых классов грамматик мы можем автоматически построить эффективный синтаксический анализатор, который определяет, корректна ли структура исходной программы.

Правильно построенная грамматика придает языку программирования структуру, которая способствует облегчению трансляции исходной программы в объектный код и выявлению ошибок. Для преобразования описаний трансляции, основанных на грамматике языка, в рабочие программы имеется соответствующий программный инструментарий.

Существует 4 типа грамматик языка (по Холмскому):

регулярные множества (A ->xB, A->x);A – не терминал, х – терминал (AT, xN)

G = <T, N, P, S>T – терминал,N – не терминал,P – правило,S – начальное правило

контекстно-свободные грамматики (КС-грамматики)

A->U*, UT,N

контекстно-зависимые грамматики

V⁺-> U*, |V⁺|  |U*|

грамматики без ограничений – грамматики, которые нельзя записать регулярными множествами

10 Контекстно-свободные грамматики. Преобразование КС-грамматик.

Контекстно-свободная грамматика состоит из терминалов, нетерминалов, стартового символа и продукций.

Терминалы представляют собой базовые символы, из которых формируются строки. Слово "токен" является синонимом слова "терминал", когда мы говорим о грамматиках языков программирования.

Нетерминалы представляют собой синтаксические переменные, которые обозначают множества строк. Нетерминалы определяют множества строк, которые помогают в определении языка, порождаемого грамматикой. Кроме того, они налагают на язык иерархическую структуру, облегчающую синтаксический анализ и трансляцию. Один из нетерминалов грамматики считается стартовым символом, и множество строк, которые он обозначает, является языком, определяемым грамматикой.

Продукции грамматики определяют способ, которым терминалы и нетерминалы могут объединяться для создания строк. Каждая продукция состоит из нетерминала, за которым следует стрелка (или символ : : =), и строка нетерминалов и терминалов.

Свойства КС – грамматик:

рекурсивность грамматики:

левая рекурсивность при A -> AB*

правая рекурсивность при A -> B*A

грамматика с -правилами (при наличии )

факторизация грамматики:

левая при A -> aB* и B -> aC*

правая при A -> B*a и B -> C*a

Дерево разбора может рассматриваться как графическое представление порождения, из которого удалена информация о порядке замещения. Каждый внутренний узел дерева разбора помечается некоторым нетерминалом A, а дочерние узлы слева направо – символами из правой части продукции, использованной в порождении для замены А. Листья дерева разбора помечены нетерминалами или терминалами и, будучи прочитаны слева направо, образуют сентенциальную форму, называемую кроной, или границей дерева.

Для того чтобы увидеть взаимосвязь между порождением и деревьями разбора, рассмотрим любое приведение а₁ => а₂=>… => а_n, где а_i— отдельный нетерминал А. Для каждой сентенциальной формы а, в приведении строим дерево разбора, результатом которого является а_i. Этот процесс представляет собой индукцию по i. Базисом служит дерево для а₁= А. которое представляет собой единственный узел, помеченный как A. Для выполнения индукции предположим, что мы уже построили дерево разбора, имеющее крону а_i_-1 = X₁X₂...X_k (вспомним, что X_i может означать терминал или нетерминал). Предположим, что а_i_-1, порождает а_i , заменой нетерминала X_j на β = Y₁Y₂... Y_r. Таким образом на i-ом шаге порождения к а_i_-1применяется продукция X_j → β порождая a = X₁ X₂... X_j-1β X_j+1...X_k.

Для моделирования этого шага находим j-й слева лист в текущем дереве разбора, который помечен X_j. Мы даем этому листу r дочерних узлов, помеченных Y₁,Y₂,...,Y_r слева направо. В специальном случае r = 0, т.е. β =ε , у j-го листа появляется один дочерний узел, помеченный ε.

<<< < Предыдущая 1 23 / 173 4 5 6 7 8 9 10 11 12 13 14 15 16 17 > Следующая >>>