Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[7 семестр] Расписанные вопросы к экзамену.pdf
Скачиваний:
8
Добавлен:
05.06.2015
Размер:
1.52 Mб
Скачать

30. Линейная модель механизма поиска по логическому выражению.

Логическое выражение поискового условия – это синтаксическая конструкция языка, задающая порядок и способ вычисления величины, принимающей значение «0» или «1». Выражение представляет собой последовательность операндов, соединенных друг с другом знаками операций. Нотация Бэкуса для такого выражения следующая: <Выражение>::=<Операнд> <Выражение><Операция> <Выражение> (<Выражение><Операция><Выражение>) Обычно: операнд

– термин(дескриптор); операция – одна из логических операций. Первый этап вычисления логического выражения может состоять в построении двоичного дерева операций. Все логические операции (кроме NOT) – бинарные => можно представить любое логическое выражение запроса в виде несбалансированного двоичного дерева, прохождение по которому снизу вверх приводит к получению результата. В узлах дерева расположены логические операции (oi), а листья (конечные узлы) представляют собой

строки матрицы L0, соотвующие терминам запроса ti bij, j 1,n0 .Операнд

запроса – отдельно вычисляемое выражение, соответствующее поддереву

запроса. Расширенная матрица «термин-документ» L . Строки – не только 0

показатели встречаемости терминов, но и результирующие векторы запросов

(Qi).

 

 

 

b

b

 

b

 

 

 

 

 

 

11 12

 

 

1n

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

b

b

 

 

b

 

 

L

 

 

21 22

 

 

2n

 

 

 

 

 

 

 

 

 

0

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

b

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D 1 D 2

D n

 

 

 

 

 

 

 

 

 

 

 

0

         

, где 1,K – количество включенных в матрицу

результирующих векторов запросов,а

 

 

b

 

 

ij

 

 

 

b

, если строка принадлежит матрице L

ij

0

q

, если строка представляет собой результат запроса

ij

 

Поставим в соответствие каждой логической операции правило ее выполнения с использованием расширенной матрицы:

 

 

 

 

 

 

 

o

 

из множества бинарных логических

 

 

 

biokbm

bijokbmj

, j 1,n0 , где

 

k

операций:ok O,O o1,o2,...,os Для унарной операции NOT это правило

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, j 1,n

реализуется следующим образом: b

 

b

 

 

 

 

 

 

 

 

 

 

i

 

ij

0

 

Тогда алгоритм разрешения двоичного дерева поискового запроса состоит в последовательном выполнении снизу вверх логических операций и в

пополнении на каждом шаге матрицы L0 очередной строкой-результатом.

Условием выполнения k-той операции служит наличие в матрице L0

строк,

 

 

соответствующих правому и левому операнду. После выполнения k-той

операции формируется результирующий вектор q

 

 

 

, который

b o b

 

k

i

k

m

 

1)-й строкой матрицы.

 

 

 

 

становится ( D

 

 

 

 

31. Линейная модель механизма поиска документов-аналогов.

Аналогами документа называются такие документы информационного массива, которые имеют заданное количество общих терминов с исходным. Задается пороговое значение близости m. Процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц документов и составлением логических выражений над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.

Выделим в матрице L0 столбец lk bik ,i 1, D , соответствующий ПОДу рассматриваемого документа, и построим подматрицу LDoc, оставив в матрице L0 те строки, в кот-х bik 0 . По матрице LDoc строится результирующий вектор запроса на поиск аналогов (QDoc ) и м.б. получен поисковый результат с учетом (или без) некоторого заданного порога «близости» (m). Результирующий вектор QDoc=(q1q2…qm), где qi==1 , т.е. суммированием элементов столбца. Далее получаем окончательный поисковый результат Kn=(k1…km), ki равно либо 0 (qi<m), документ не является аналогом,либо 1(qi>=m), является аналогом.