30. Линейная модель механизма поиска по логическому выражению.

Логическое выражение поискового условия – это синтаксическая конструкция языка, задающая порядок и способ вычисления величины, принимающей значение «0» или «1». Выражение представляет собой последовательность операндов, соединенных друг с другом знаками операций. Нотация Бэкуса для такого выражения следующая: <Выражение>::=<Операнд> <Выражение><Операция> <Выражение> (<Выражение><Операция><Выражение>) Обычно: операнд

– термин(дескриптор); операция – одна из логических операций. Первый этап вычисления логического выражения может состоять в построении двоичного дерева операций. Все логические операции (кроме NOT) – бинарные => можно представить любое логическое выражение запроса в виде несбалансированного двоичного дерева, прохождение по которому снизу вверх приводит к получению результата. В узлах дерева расположены логические операции (oi), а листья (конечные узлы) представляют собой

строки матрицы L0, соотвующие терминам запроса ti bij, j 1,n0 .Операнд

запроса – отдельно вычисляемое выражение, соответствующее поддереву

запроса. Расширенная матрица «термин-документ» L . Строки – не только 0

показатели встречаемости терминов, но и результирующие векторы запросов

(Qi).

	b		b		b
		11 12				1n
						0
	b		b			b
L		21 22				2n
L						0
0

		b		b		b
		b		b		b

		D 1 D 2				D n
							0

         

, где 1,K – количество включенных в матрицу

результирующих векторов запросов,а


b
b
ij

b	, если строка принадлежит матрице L
ij	0
q	, если строка представляет собой результат запроса
ij

Поставим в соответствие каждой логической операции правило ее выполнения с использованием расширенной матрицы:

из множества бинарных логических

biokbm

bijokbmj

, j 1,n0 , где

операций:ok O,O o1,o2,...,os Для унарной операции NOT это правило

, j 1,n

реализуется следующим образом: b

Тогда алгоритм разрешения двоичного дерева поискового запроса состоит в последовательном выполнении снизу вверх логических операций и в

пополнении на каждом шаге матрицы L0 очередной строкой-результатом.

Условием выполнения k-той операции служит наличие в матрице L0	строк,

соответствующих правому и левому операнду. После выполнения k-той

операции формируется результирующий вектор q					, который
операции формируется результирующий вектор q		b o b			, который
	k	i	k	m
	1)-й строкой матрицы.
становится ( D	1)-й строкой матрицы.

31. Линейная модель механизма поиска документов-аналогов.

Аналогами документа называются такие документы информационного массива, которые имеют заданное количество общих терминов с исходным. Задается пороговое значение близости m. Процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц документов и составлением логических выражений над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.

Выделим в матрице L0 столбец lk bik ,i 1, D , соответствующий ПОДу рассматриваемого документа, и построим подматрицу LDoc, оставив в матрице L0 те строки, в кот-х bik 0 . По матрице LDoc строится результирующий вектор запроса на поиск аналогов (QDoc ) и м.б. получен поисковый результат с учетом (или без) некоторого заданного порога «близости» (m). Результирующий вектор QDoc=(q1q2…qm), где qi=∑=1 , т.е. суммированием элементов столбца. Далее получаем окончательный поисковый результат Kn=(k1…km), ki равно либо 0 (qi<m), документ не является аналогом,либо 1(qi>=m), является аналогом.

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 2714 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
27.03.2016918.46 Кб42Zhuravleva_Sbornik_dopolnitelnyh_grammaticheskih_2014.pdf
#
05.06.20153.11 Mб7ZinovyevBook.pdf
#
05.06.20152.61 Mб240zverkoff_otvet.pdf
#
05.06.2015263.06 Кб23[7 семестр] SAP (2014). Вопросы к зачёту.pdf
#
04.06.2015879.86 Кб18[7 семестр] Расписанные вопросы к экзамену.docx
#
05.06.20151.52 Mб8[7 семестр] Расписанные вопросы к экзамену.pdf
#
04.06.201594.72 Кб68_ДЗ№3.docx
#
21.11.201954.27 Кб8_ОИБ (2 к) л-3.doc
#
21.11.201974.75 Кб7_ОИБ (2 к) л-4.doc
#
25.11.201972.7 Кб3_ОИБ (2 к) л-6.doc
#
25.11.2019208.38 Кб10_ОИБ (2 к) л-7.doc