
- •Балтийский федеральный университет имени Иммануила Канта
- •Расчетно-графическая работа №1 Тема: «Системы счисления».
- •Правила перевода целых чисел
- •Правила перевода правильных дробей
- •Правила сложения
- •Правила вычитания
- •Правила умножения
- •Правила деления
- •Расчетно-графическая работа №2
- •1.2 Статистический подход к измерению информации
- •Расчетно-графическая работа №3
- •Метод Шеннона-Фано
- •Метод Хаффмана
- •Расчетно-графическая работа №4 Тема: «Разработка формальной грамматики Хомского».
- •1.1 Формальная грамматика
- •1.2 Пример построения грамматики
- •1.3 Представление грамматики в виде графа
- •1.5 Классификация формальных грамматик
- •Расчетно-графическая работа №5 Тема: «Нормальные алгоритмы Маркова и машины Тьюринга».
- •Расчетно-графическая работа №6 Тема: «Расчет числовых характеристик графов».
- •Расчетно-графическая работа №7 Тема: «Нахождение кратчайшего остова неориентированного графа по алгоритму Дейкстра».
- •Расчетно-графическая работа №8 Тема: «Поиск кратчайших путей на неориентированном графе по алгоритму Флойда».
- •Расчетно-графическая работа №9 Тема: «Архивирование файлов алгоритмом Зива-Лемпеля-Велча».
1.3 Представление грамматики в виде графа
Граф грамматики
в качестве вершин содержит цепочки,
выводимые из начального символа. Ниже
на рисунке дано представление грамматики
,
где
{a,b,c},
{S},
{S→
aSa
| bSb
| c}.
1.5 Классификация формальных грамматик
Множество формальных грамматик можно разложить на классы в зависимости от ограничений, накладываемых на продукции. Такие ограничения формируют особые свойства грамматик и особые методы анализа и синтеза цепочек символов. Общепринятой классификацией грамматик и порождаемых ими языков является иерархия грамматик Хомского, содержащая четыре типа грамматик.
Грамматика типа 0- грамматика произвольного типа без каких-либо ограничений на цепочки символов. Продукции этой грамматики имеют вид:
.
В обеих частях продукции могут быть в произвольном порядке и любом количестве терминальные и нетерминальные символы, т.е. V*, где верхним левым индексом «*» обозначено множество с пустым символом e, а знак "::=" означает: "...присвоить значение...". Такой тип грамматики порождает множество перечислимых языков, для которых существует перечисляющий алгоритм. Такой алгоритм может быть реализован на машине Тьюринга, являющейся классической моделью рекурсивной функции. Поэтому такие языки называют также рекурсивно-перечислимыми. Однако такой тип грамматики не нашел применения в языках программирования.
Пример 1. Пусть дана грамматика G1 = < VT; VH; P; J > , где
VT = { a; b } ; VH = { A;B;C;J };
P = { р1 : J ::= AbBb; р2 : J ::= AbJBb; р3 : Ab ::= Bba;
р4 : Bb ::= Cba; р5 : Cb ::= ba } .
Какие цепочки терминальных символов формирует грамматика ?
Рассмотрим левосторонний вывод:
J =>AbBb =>BbaBb =>CbaaBb =>baaaBb =>baaaCba = ( ba3)(ba2);
J =>AbJBb => BbaJBb => CbaaJBb => baaaJBb =>baaaAbBbBb => baaaBbaBbBb => baaaCbaaBbBb => baaabaaaBbBb => baaabaaaCbaBb =>
baaabaaabaaBb => baaabaaabaaCba => baaabaaabaabaa = (ba3)2(ba2)2;
J =>AbJBb => BbaJBb => CbaaJBb => baaaJBb => baaaAbJBb => baaaBbaJBb =>...=> baaabaaabaaabaabaabaa = (ba3)3(ba2)3; и т.д.
Грамматика G1 формирует множество цепочек, используя процедуру итерации:
L(G1) = { (ba3)i (ba2)i | i = 1;2;3;... }.
Пример 2. Пусть дана грамматика G2 = < VT; VH; P; J > , где
VT = { a; b } ; VH = { A;J } ;
P = { р1 : J ::= JAa | b; р2 : aA ::= Aa ; р3 : bA ::= ab }
Какие цепочки терминальных символов формирует грамматика ?
Используем также левосторонний вывод терминальных цепочек:
J => b;
J => JAa => bAa => aba;
J => JAa => JAaAa => bAaAa => abaAa => abAaa => aabaa = a2ba2;
J => JAa => JAaAa =>JAaAaAa => ... => aaabaaa = a3ba3; и т.д.
Грамматика G2 формирует множество цепочек, также используя процедуру итерации:
L(G2) = { aibai | i = 0;1;2;3;... }.
Грамматика типа 1 - это контекстно-зависимая грамматика или грамматика непосредственных составляющих (НС-грамматика). Второе название грамматики объясняется тем, что любую цепочку можно разложить на синтаксические составляющие (члены предложения естественного языка) и выполнить разбор каждой синтаксической переменной (части речи естественного языка) в составе синтаксической составляющей. В естественных языках для этого проводят грамматической разбор структуры предложения. В языках программирования - грамматический разбор структуры программы, что всегда необходимо при трансляции исходной программы на язык вычислительной машины.
Продукции этой грамматики имеют вид:
1212 ,
где AVH;
1, 2, V*,
1 левый контекст,
2 правый контекст.
Каждый шаг вывода состоит в замене одного вхождения нетерминального символа вхождением цепочки терминальных и/или нетерминальных символов. Эта замена обусловлена наличием левого и правого контекстов.
Для НС-грамматики существенным является исполнение условия:
1212
где |...| означает длину цепочки символов, заключенных между вертикальными линиями.
Это требует исполнения в каждом правиле второго условия:
.
Грамматики, в которых все правила обладают этими свойствами называют неукорачивающими.
Множество языков НС-грамматики является собственным подмножеством языков грамматики типа 0.
Для НС-грамматики возможны случаи:
1) 11когда 2 ;
2) 22 , когда 1 .
Для НС-грамматик также допустим лево- и правосторонний вывод, когда продукции грамматики применяются к самому левому или самому правому нетерминальному символу анализируемой цепочки.
Пример 3. Пусть дана грамматика G3 = < VT; VH; P; J > , где
VT = { a; b; c} ; VH = {B; C; J } ;
P = { р1 : J ::= aJBC | aBC; р2 : CB ::= DB;
р3 : DB ::= DC; р4 : DC ;;= BC; р15 : aB ::= ab;
р6 : bB ::= bb; р7 : bC ::= bc; р8 : cC ::= cc }.
Какие цепочки терминальных символов формирует грамматика ?
В каждом правиле есть либо левый, либо правый контексты.
Используем также левосторонний вывод терминальных цепочек:
J => aBC => abC => abc;
J => aJBC => aaBCBC => aabCBC =aabDBC => aabDCC => aabBCC => aabbCC => aabbcC => aabbcc = a2b2c2;
J => aJBC => aaJBCBC => ... => aaabbbccc = a3b3c3 и т.д.
Грамматика G3 формирует цепочки терминальных символов, используя операцию итерации:
L(G3) = { aibici | i = 1;2;3;... }.
Грамматика типа 2 - это контекстно-свободная грамматика (КС-грамматика). Правила этой грамматики не зависят от контекста, т.е. в левой части каждого правила находится только один нетерминальный символ, а в правой части цепочка терминальных и/или нетерминальных символов.
Продукции этой грамматики имеют вид:
A ::= ,
где V*.
Каждый шаг вывода связан с заменой в цепочке одного нетерминального символа на цепочку терминальных и/или нетерминальных символов.
Множество КС-языков при выполнении условий 1 , 2 и является подмножеством НС-языков.
КС-грамматики наиболее эффективно описывают состав и структуру формального языка. Поэтому они нашли применение в большинстве языков программирования. Для унификации языков программирования были разработаны метаязыковые средства описания синтаксических конструкций. Особое место среди этих средств занимают формулы Бэкуса-Наура (БНФ).
Для КС-грамматик также удобен фиксированный способ вывода (лево- или правосторонний ).
Пример 4. Пусть дана грамматика G4 = < VT; VN; P; J > ,
где VT = { буква; цифра} ; VH = {A; B; J } ;
P = { р1 : J ::= JA | JB | A;
р2 : A ::= буква;
р3 : B ::= цифра }.
Какие цепочки терминальных символов формирует грамматики?
Для удобства доказательства сохраним левосторонний вывод:
J => A => буква;
J => JA => AA => буква буква;
J => JB => AB => буква цифра;
J => JA => JAA => AAA => ... => буква буква буква;
J => JA => JBA => ABA => ... => буква цифра буква;
J => JB => JAB => AAB => ...=> буква буква цифра;
J => JB => JBB => ABB => ...=> буква цифра цифра и т.д.
Грамматика G4 формирует следующие цепочки терминальных символов:
L(G4) = { буква { буква | цифра } }.
Такова грамматика для формирования идентификаторов большинства языков программирования.
Грамматика типа 3 (регулярная) - это линейная грамматика, правила которой содержат в правой части не более одного нетерминального символа.
Продукции этой грамматики имеют вид:
A ::= 1B2 или A ::=
где 1, 2, V*\VN.
Продукция линейной грамматики называется праволинейной (леволинейной), если единственный нетерминальный символ в правой части продукции всегда находится крайним справа (слева).
Например, А ::= 1B - праволинейная продукция,
A ::= B2 - леволинейная продукция.
Если все продукции грамматики праволинейные или леволинейные, то грамматика также называется праволинейной или леволинейной. Каждой праволинейной грамматике соответствует эквивалентная ей леволинейная грамматика. В зависимости от типа грамматики различают праволинейные и леволинейные языки.
Языки линейной грамматики представляют собственное подмножество множества КС-языков.
Пример 5. Пусть дана грамматика G5 = < VT; VH; P; J >
где VT = {a; b; c } ; VH = { A; B; J; } ;
P = { р1 : J ::= Bb; р2 : A ::= Aa | a; р3 : B ::= Bb | Aac | ac }.
Какие цепочки терминальных символов формирует грамматика ?
Можно отметить, что все правила этой грамматики -леволинейные.
Проведем левосторонний вывод терминальных цепочек:
J Bb acb
Aacb aacb
acbb Bbb
aacbb Aacbb Aaacb aaacb
aaacbb Aaacb
Bbbb acbbb
Грамматика G5 формирует цепочки вида:
L( G5 ) = { aicbj | i,j = 1;2;3;... }.
Примеры решения задач
Пример 1. Приведите примеры не менее чем пяти языков в алфавите:
Σ={a,b,c,d,e}
Пример 2. Построить праволинейную грамматику для языка, состоящего из 1 и 0 с четным числом нулей и единиц.
Пример 3. Построить КС-грамматику, порождающую правильно расставленные скобки
Пример 4. Даны грамматики G1 = ({0,1}, {A,S}, P1, S) и G2 = ({0,1}, {S}, P2, S).
P1: S→0A1, 0A→00A1, A→ и P2: S→0S1 | 01. Определить языки грамматик и их типы.
Пример 5. Построить грамматику, порождающую язык L = {anbncn | n>0}. Получить вывод терминальной цепочки aaabbbccc.
Задание
Для выбранной в соответствии с вариантом задания задачи:
Разработать формальную грамматику Хомского G, порождающую цепочки языка L(G).
Построить вывод заданной в варианте задания цепочки.
Представить грамматику в виде графа.
Определить класс, к которому принадлежит грамматика.
Сделать выводы.
Содержание отчета
Определение понятия «Формальная грамматика Хомского».
Определение алфавита терминальных символов.
Определение алфавита нетерминальных символов.
Определение начального символа.
Определение правил вывода.
Вывод заданной цепочки языка.
Разработка графа грамматики.
Определение класса грамматики.
Анализ результатов и выводы.
Варианты задания
Ниже даны варианты задания, в каждом из которых в качестве способа описания формального языка выбран алгебраический способ. Помимо алгебраического описания языка вариант задания включает цепочку, для которой должен быть построен вывод в грамматике.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17. L(G) = {13n+2 0n | n≥0}, 1111111100;
18. L(G) = {0n 1m | n>m и n,m >0 }, 00000000011111;
19. L(G) = { anb3mcma2n | n>1 и m>1 }, aabbbbbbccaaaa.
Список литературы
Волкова И.А., Руденко Т.В. Формальные грамматики и языки. Элементы теории трансляции. / Учебное пособие для студентов II курса. Издание второе. - М: ВМиК МГУ, 1999.
Пономарев В.Ф. Формальные языки и грамматики. / Учебное пособие. - Калининград: КГТУ, 1998.