7.2 Непрямой лексический анализатор dpl

Непрямой лексический анализатор, в соответствии с ранее описанной теорией, реализуется как совокупность независимых конечных автоматов, проверяющих принадлежность к отдельным лексемам. А эти автоматы, как было показано ранее, можно описать с использованием диаграмм Вирта. Практическая же целесообразность диктует следующие технические решения.

Конечный автомат, осуществляющий распознавание одной конкретной лексемы, может быть разбит на несколько, более мелких автоматов, каждый из которых распознает непересекающееся подмножество цепочек, принадлежащих искомому классу. Например, при распознавании целого числа можно построить отдельные автоматы для выявления двоичных, восьмеричных, десятичных, десятичных с префиксом и шестнадцатеричных чисел. Это упрощает реализацию отдельных автоматов. Для упрощения реализации можно также осуществлять создание автоматов, распознающих цепочки, являющиеся подцепочками других автоматов. В этом случае необходимо таким образом строить арбитраж, чтобы распознавание более длинных цепочек осуществлялось раньше. В качестве примера распознаватель действительного числа искусственно разбит на пять автоматов (!). Конечно, в реальной ситуации «дробить» таким образом действительное число вряд ли имеет смысл.

Автоматы можно не только разделять, но и объединять, что ведет к использованию фрагментов прямого лексического анализа.

Можно также использовать и семантический анализ, что позволяет сократить код и ускорить разбор. На Рисунке 7.1а показан возможный вариант разбора ключевых слов.

Рисунок 7.1 Повышение эффективности анализа ключевых слов

в непрямом лексическом анализаторе за счет использования

семантической обработки

Рисунок 7.1 Повышение эффективности анализа ключевых слов

в непрямом лексическом анализаторе за счет использования

семантической обработки (окончание)

Для распознавания каждого ключевого слова можно построить свой автомат. В этом случае возникает несколько проблем:

– замедляется разбор, что связано с постоянными откатами, используемыми в непрямом лексическом анализаторе (чем больше автоматов, тем медленнее разбор, а ключевых слов может быть много);

– состав ключевых слов может постоянно меняться (особенно, в новом языке), что ведет к необходимости модификации кода программы.

Гораздо проще и быстрее провести распознавание ключевых слов с использованием семантической обработки. Чаще всего (а в данном случае – это факт) ключевые слова являются подмножеством идентификаторов. Поэтому, можно в начале осуществить выявление идентификатора, а затем провести его анализ на принадлежность к ключевому слову. Такой анализ можно осуществлять поиском (лучше всего двоичным) значения полученного идентификатора в таблице ключевых слов. При обнаружении совпадения формируется лексема, соответствующая выявленному ключевому слову. В противном случае выдается лексема - идентификатор. Соответствующая этому случаю диаграмма Вирта, вместе с блоком семантического разбора (представленного шестиугольником) приведена на Рисунке 7.1б. Аналогичную схему имеет смысл использовать и в прямом лексическом анализаторе.

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 1415 / 2815 16 17 18 19 20 21 22 23 24 25 26 27 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.11.2018269.82 Кб14TMO_RGR.doc
#
01.05.20251.9 Mб2Tokarno-vintorezny_stanok_Lab_1.doc
#
01.05.2025404.99 Кб0Tom1_,без фото.doc
#
01.07.202512.43 Mб0TPAP_LEKTsIYa_2_Elementy_TP.docx
#
01.04.2025755.71 Кб2TP_н31-36.doc
#
01.03.20251.07 Mб4trans.doc
#
19.05.201534.78 Mб561Trenirovochnye_metody_Westside-Barbell.pdf
#
19.05.2015174.29 Кб10Ts-242_1_vvvpeedelanyаааа.docx
#
01.07.2025111.96 Кб0TTP-103_1-8_seminar.docx
#
29.09.201991.14 Кб3Tukhkanen_Materialy_praktiki_IEU.doc
#
01.07.20251.93 Mб0TV_Gas34_2.doc