Алгоритм Кока-Янгера-Касами.

Обсуждаемый алгоритм предназначен для разбора методом «снизу-вверх» слов любой контекстно-свободной грамматики, т.е. это – универсальный метод. Для его применения грамматика должна быть преобразована к нормальной форме Хомского (т.е. правила имеют вид: Aa или ABC). Этот алгоритм имеет сложность O(n³) по времени и O(n²) по памяти. На первом этапе алгоритм строит треугольную таблицу с элементами t_ik, в каждую клетку которой помещается множество нетерминалов, из которых можно вывести отрезок слова начинающийся с символа a_i и длиной k.

Формально: t_ik = {A | Aa_i…a_i+k-1}. Очевидно, что множества t_ik формально (рекурсивно) можно определить так:

t_i₁ = {A | Aa_i - правило грамматики},

t_ij = {A | ABC - правило грамматики и k, 1k<j такое, что Bt_ik  Ct_i₊_k_,_j_-_k}.

Если в t₁_n есть S, то слово  языку.

t₁₆
t₁₅	t₂₅
t₁₄	t₂₄	t₃₄
t₁₃	t₂₃	t₃₃	t₄₃
t₁₂	t₂₂	t₃₂	t₄₂	t₅₂
t₁₁	t₂₁	t₃₁	t₄₁	t₅₁	t₆₁
a₁	a₂	a₃	a₄	a₅	a₆

Пусть заполнены все строки таблицы до j-1 включительно. Рассмотрим t_ij.

Эта ячейка соответствует фрагменту слова <a_i…a_i₊_j_-1>. Разбиваем этот фрагмент на пары слов всеми способами. Каждому варианту разбиения соответствует пара клеток таблицы, в которых стоят нетерминалы, из которых могут быть выведены соответствующие строки. Пусть это пара (t,t). В t_ij поместим нетерминал A, если есть правило ABC и Bt, Ct.

Пример. Рассмотрим неоднозначную грамматику: G = ({S,L,R}, {(,)}, {SSS | LR, L(, R)}, S). Пусть задано слово ()()(). Построим таблицу.

S₁₆

S₁₄		S₃₄

S₁₂		S₃₂		S₅₂
L₁₁	R₂₁	L₃₁	R₄₁	L₅₁	R₆₁
(	)	(	)	(	)

На втором этапе восстанавливаем дерево вывода.

Это можно выполнить с помощью следующей рекурсивной процедуры:

GEN(i,j,A)

| 1. Если j=1  Aa_i – правило с номером m, то выдать m.

| 2. Если j>1. Пусть k – наименьшее из чисел, для которых  Bt_ik Ct_i₊_k_,_j_-_k и ABCR

| имеет номер m. Выбрать это правило, выдать m и выполнить последовательно:

| GEN(i,k,B) ???

 GEN(i+k,j-k,C) ???

Старт: GEN(1,n,S)

Замечание. Описанный алгоритм существенно опирается на то, что грамматика имеет форму Хомского.

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025172.03 Кб111 Представление аналогового сигнала в цифровом виде.doc
#
10.02.2015312.13 Кб11511-20.docx
#
24.11.2019128.63 Кб2411. Святые праведные.docx
#
23.09.2019101.7 Кб3811111.docx
#
19.12.201846.08 Кб61112_vliyanie_nefti.doc
#
30.11.2018167.94 Кб7411_транс_1.doc
#
01.07.2025108.54 Кб212 Преступные группы.DOC
#
28.09.201962.98 Кб7112,24,36,48,60,72,96..doc
#
24.11.2019144.8 Кб5712. Женская святость.docx
#
01.07.2025617.77 Кб11248568.rtf
#
01.04.20252.02 Mб20126084.rtf