Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Сибирский государственный университет науки и технологий им. академика М.Ф. Решетнева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции СисПО.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

731.14 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 223 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

2.3. Грамматики

2.3.1. Формальное определение грамматики

Для нас наибольший интерес представляет одна из систем генерации языков – грамматики. Понятие грамматики изначально было формализовано лингвистами при изучении естественных языков. Предполагалось, что это может помочь при их автоматической трансляции. Однако наилучшие результаты в этом направлении достигнуты при описании не естественных языков, а языков программирования. Примером может служить способ описания синтаксиса языков программирования при помощи БНФ – формы БэкусаНаура, которая предполагает использование в качестве нетерминальных символов комбинаций слов естественного языка, заключенных в угловые скобки, а в качестве разделителя - специального знака, состоящего из двух двоеточий и равенства. Например, если правила <L><L> и <L><E> записаны в символической форме, и символ <L> соответствует синтаксическому понятию "список", а символ <E> - "элемент списка", то их можно представить в форме Наура-Бэкуса так:

<список>::= <элемент списка><список>, <список>::= <элемент списка>.

Чтобы сократить описание схемы грамматики, в БНФ разрешается объединять правила c одинаковой левой частью в одно правило, правая часть которого должна включать правые части объединяемых правил, разделенные вертикальной чертой. Используя объединение правил, для рассматриваемого примера получаем:

<список>::=<элемент списка><список>|<элемент списка>.

Декартовым произведением A  B множеств A и B называется множество {(a,b) | a  A, b  B}.

Порождающая грамматика G - это четверка (VT, VN, P, S), где

VT - алфавит терминальных символов (терминалов), то есть множество таких символов, которые считаются известным и не требуют определения;

VN - алфавит нетерминальных символов (нетерминалов), не пересекающийся с VT, то есть множество таких символов, которые требуют определения в грамматике;

P - это конечное подмножество множества (VT  VN)⁺  (VT  VN)^*;

Р является множеством правил или продукций (то есть способов определения нетерминальных символов) вида {   } (из некоторой цепочки  следует цепочка ), где  образована из терминальных или нетерминальных символов, а также может быть пустой:   ( VTVN )*, а  - цепочка, которая в общем случае содержит как терминалы, так и нетерминалы, но в ней обязательно должен быть один нетерминал.

Элемент (, ) множества P называется правилом вывода и записывается в виде   ,

S - начальный символ (цель) грамматики, нетерминал, S  VN.

Мы будем использовать большие латинские буквы для обозначения нетерминальных символов, малые латинские буквы из начала алфавита для обозначения терминальных символов, малые латинские буквы из конца алфавита для обозначения цепочек из VT^* и, наконец, малые греческие буквы для обозначения цепочек из ( VTVN )*.

Для записи правил вывода с одинаковыми левыми частями

  ₁  ₂ ...   _n

будем пользоваться сокращенной записью

  ₁ | ₂ |...| _n.

Каждое _i, i= 1, 2, ... ,n , будем называть альтернативой правила вывода из цепочки .

Пример 2.3

1) Грамматика G1 = ({0,1}, {A,S}, P, S),

где P состоит из правил Р={ S  0A1, 0A  00A1, A  }

Применяя последовательно правила (S  0A1  00A11  0011), получаем цепочку 0011.

Эта грамматика порождает язык L(G1) = {0ⁿ 1ⁿ |n > 0}.

2) Грамматика G2 = ({a, b, c}, {S, B, C}, P, S),

P = {S  aSBC, S  aBC, CB  BC, aB  ab, bB  bb, bC  bc, cC  cc}.

Эта грамматика порождает язык L(G2) = {aⁿ bⁿ cⁿ |n > 0}.

Действительно, применяем n - 1 раз правило 1 и получаем a^n-1 S(BC)^n-1 , затем один раз правило 2 и получаем aⁿ (BC)ⁿ , затем n(n - 1)/2 раз правило 3 и получаем aⁿBⁿCⁿ. Затем используем правило 4, получаем aⁿbB^n-1Cⁿ . Затем применяем n – 1 раз правило 5 и получаем aⁿbⁿCⁿ. Затем применяем правило 6 и n - 1 раз правило 7 и получаем aⁿbⁿcⁿ. Можно показать, что язык L(G2) состоит из цепочек только такого вида.

3) Грамматика G3 = ({0, 1},{S}, {S  0S1, S  01}, S).

Легко видеть, что цепочка 000111  L(G), так как существует вывод

S  0S1  00S11  00111

Нетрудно показать, что грамматика порождает язык L(G3) = {0ⁿ 1ⁿ |n > 0}.

Грамматика

G4 = ({0, 1},{S, A}, {S  0S, S  0A, A  1A, A  1}, S)

порождает язык L(G4) = {0ⁿ 1^m |n,m > 0}, что нетрудно показать.

Цепочка   (VT  VN)^* называется непосредственно выводимой из цепочки   (VT  VN)⁺ в грамматике G = (VT, VN, P, S) (обозначим   ), если  = ₁₂,  = ₁₂, где ₁, ₂,   (VT  VN)^*,   (VT  VN)⁺ и правило вывода    содержится в P.

Например, цепочка 00A11 непосредственно выводима из 0A1 в грамматике G1.

Цепочка  (VT  VN)^* называется выводимой из цепочки   (VT  VN)⁺ в грамматике G = (VT, VN, P, S) (обозначим   ), если существуют цепочки ₀, ₁, ... , _n(n0), такие, что  = ₀  ₁  ...  _n= .

Последовательность ₀, ₁, ... , _nназывается выводом длины n.

Например, S  000A111 в грамматике G1 (см. пример 2.3), так как существует вывод S  0A1  00A11  000A111. Длина вывода равна 3.

Языком, порождаемым грамматикой G = (VT, VN, P, S), называется множество L(G)={  VT^*| S  }.

Другими словами, L(G) - это все цепочки в алфавите VT, которые выводимы из S с помощью P.

Например, L(G1) = {0ⁿ1ⁿ | n>0}.

Цепочка   (VT  VN)^*, для которой S  , называется сентенциальной формой в грамматике G = (VT, VN, P, S).

Таким образом, язык, порождаемый грамматикой, можно определить как множество терминальных сентенциальных форм.

Грамматики G1 и G2 называются эквивалентными, если L(G1) = L(G2).

Пример 2.4

Грамматики G1 = ({0,1}, {A,S}, P1, S) и G2 = ({0,1}, {S}, P2, S), где

P1={ S  0A1, 0A  00A1, A   P2={S  0S1 | 01}

эквивалентны, так как обе порождают язык

L(G1) = L(G2) = {0ⁿ1ⁿ | n>0}.

Грамматики G1 и G2 называются почти эквивалентными, если

L(G1)  { = L(G2)  {.

Другими словами, грамматики почти эквивалентны, если языки, ими порождаемые, отличаются не более чем на .

Пример 2.5

Грамматики G1 = ({0,1}, {A,S}, P1, S) и G2 = ({0,1}, {S}, P2, S), где

P1={ S  0A1, 0A  00A1, A   P2={ S  0S1 | 

являются почти эквивалентными, так как

L(G1)={0ⁿ1ⁿ | n>0}, а L(G2)={0ⁿ1ⁿ | n0}, то есть L(G2) состоит из всех цепочек языка L(G1) и пустой цепочки, которая в L(G1) не входит.

<<< < Предыдущая 1 23 / 223 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.20251.87 Mб0лекции по реологии.doc
#
02.12.2018144.85 Кб40Лекции по фотограметрии за 3 курс первый семест....docx
#
23.09.2019194.86 Кб1лекции по экономике машиностоительного производ...docx
#
01.05.20253.64 Mб0Лекции по экономике.doc
#
24.09.201967.68 Кб8лекции по экономической теории.docx
#
01.05.2025731.14 Кб0Лекции СисПО.doc
#
17.03.2015209.41 Кб9Лекции спецрежимы.doc
#
11.11.2019268.51 Кб7Лекции спрос и предложение и эластичность.docx
#
17.03.20151.88 Mб54ЛЕКЦИИ СТАТ.doc
#
01.04.20252.36 Mб6ЛЕКЦИИ ТМС АК. А.docx
#
01.03.202524.95 Mб9ЛЕКЦИИ ТМС Д_1.doc