Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский национальный исследовательский университет им. ак. С.П. Королёва (бывш. СГАУ, СамГУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

tfg_lecture.doc

Скачиваний:

172

Добавлен:

16.03.2015

Размер:

2.63 Mб

Скачать

☆

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2918 19 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

5.4. Неоднозначность кс-грамматик и языков

Напомним, что КС-грамматика G неоднозначна, если существует цепочка L(G), имеющая два или более различных деревьев вывода. Если грамматика используется для определения языка программирования, желательно, чтобы она была однозначной. В противном случае программист и компилятор могут по-разному понять смысл некоторых программ. Неоднозначность - нежелательное свойство КС-грамматик и языков.

Пример неоднозначной КС-грамматики арифметических выражений был рассмотрен в параграфе 1.1. Но самый известный пример неоднозначности в языках программирования - это “кочующее else”.

Пример 5.5. Рассмотрим грамматику с правилами вывода

S  if b then S else S if b then Sa

Эта грамматика неоднозначна, так как цепочка

if b then if b then a else a

имеет два дерева вывода, первое из которых (рис 5.6 (а)) предполагает интерпретацию

if b then (if b then a) else a ,

а второе (рис 5.6 (б))-

if b then (if b then a else a)



Хотелось бы иметь алгоритм, который по произвольной КС-грамматике выяснял, однозначна она или нет. Но, к сожалению, можно доказать, что проблема - однозначна ли КС-грамматика G - алгоритмически неразрешима. Хотя такого алгоритма нет, можно указать некоторые встречающиеся в правилах конструкции, приводящие к неоднозначности, которые можно распознать на практике и избегать при описании языков программирования.

Грамматика, содержащая правила A  AA , неоднозначна, так как подцепочка AAA допускает два различных разбора (рис. 5.7).

Здесь можно устранить неоднозначность, если вместо предложенных правил с двухсторонней рекурсией использовать одностороннюю, то есть использовать правила:

A  ABB

B  

или правила

A  BAB

B  

Другой пример неоднозначности - правило A  AA , так как цепочку AAA можно получить по двум разным деревьям вывода. Пара правил

A  AA тоже создает неоднозначность - цепочка A имеет два разных левых вывода A  A  A и A  A  A.

Все перечисленные примеры так или иначе связаны с двухсторонней рекурсией. Более тонкий пример - пара правил A  AAA , по которым цепочка AA имеет два вывода A  AA  AA и A  A  AA . Если при двухсторонней рекурсии средством борьбы с неоднозначностью является устранение рекурсии с одной из сторон, то в последнем случае поможет левая факторизация.

Из приведенных примеров ясно, что определенная выше неоднозначность - это свойство грамматики, а не языка. Для некоторых неоднозначных грамматик можно построить эквивалентные им однозначные грамматики.

Пример 5.6. Рассмотрим грамматику из примера 5.5. Эта грамматика неоднозначна потому, что else можно ассоциировать с двумя различными then. Неоднозначность можно устранить, если связать else с последним из предшествующих ему then, как на рис. 5.6 (б). Для этого введем два нетерминала S₁ и S₂ с тем чтобы S₂ порождал только полные операторы вида if-then-else, а S₁ - операторы обоих видов. Правила новой грамматики имеют вид

S₁  if b then S₁if b then S₂ else S₁a

S₂  if b then S₂ else S₂a

Тот факт, что слову else предшествует только S₂, гарантирует появление внутри конструкции then-else либо символа a, либо другого else. Таким образом, структура, изображенная на рис. 5.6 (а), здесь не возникает. 

КС-язык называется неоднозначным (или существенно неоднозначным), если он не порождается никакой однозначной КС-грамматикой.

С первого взгляда не видно, существуют ли вообще неоднозначные КС-языки, но нашим следующим примером и будет такой язык.

Пример 5.7. Пусть L= {aⁱb^jc^k i = j или j = k}. Этот язык неоднозначен, что можно строго доказать. Интуитивно же это объясняется тем, что цепочки с i = j должны порождаться группой правил, отличных от правил, порождающих цепочки с j = k. Тогда, по крайней мере, некоторые из цепочек с i = j = k должны порождаться обоими механизмами. Одна из КС-грамматик, порождающих L, такова:

S  ABDC

A  aA

B  bBc

C  cC

D  aDb

Ясно, что она неоднозначна и на рис. 5.8 представлены два дерева вывода цепочки aabbcc. Проблема, порождает ли данная КС-грамматика однозначный язык (т.е. существует ли эквивалентная ей однозначная грамматика), алгоритмически неразрешима. Но для некоторых больших подклассов КС-языков известно, что они однозначны. Именно к этим подклассам и относятся все созданные до сих пор языки программирования.

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2918 19 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.09.2019155.49 Кб122Test (1).docx
#
28.03.20161.1 Mб167testovye_zadaniya_po_russkomu_yazyku_dlya_podgotovki_k_ege.pdf
#
16.03.201533.48 Кб37Testy_dlya_samokontrolya.docx
#
26.11.201964.06 Кб17Testy_mediki_i_ASU.docx
#
16.03.2015279.55 Кб83testy_po_marketingu.doc
#
16.03.20152.63 Mб172tfg_lecture.doc
#
07.06.2015279.86 Кб19TGP_Ekzamen_1_kurs.docx
#
16.03.201553.48 Кб23Theoretical_Grammar.docx
#
13.11.201990.11 Кб1Topics_темы.doc
#
18.04.20191.85 Mб14tsu.docx
#
29.03.2016280.06 Кб78Tupo shpora.doc