Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Расписанные ответы на вопросы (новые).doc
Скачиваний:
58
Добавлен:
04.06.2015
Размер:
5.48 Mб
Скачать
  1. Линейная модель механизма поиска по совпадению терминов.

При поиске по совпадению терминов задается требование полного или частичного совпадения. Частичное совпадение осуществляется с помощью маскирования.

Формирование поискового образа запроса (ПОЗ): выбираем из матрицы L0 строки, которые соответствуют терминам, указанным в запросе. Если термин не найден, ему ставится в соответствие строка, состоящая из нулей. Для k терминов получаем подматрицу запроса (Lq):

Построим результирующий вектор запроса:

Окончательный поисковый результат м.б. сформирован по двум правилам: документ считается формально релевантным запросу, если содержит все k терминов, или если содержит хотя бы часть (один, два, три и т.д.) из k терминов. При реализацииполучаем:

Для реализации 2-го правила зададим границу m, определяющую min-е количество терминов, необходимое для отнесения документа к релевантным документам.

  1. Линейная модель механизма поиска по логическому выражению.

Логическое выражение-это последовательность терминов, объединенных знаками логических операций; синтаксическая конструкция языка, вычисляющая величины, которые принимают значение «0» или «1».

Логические операции: AND, OR, XOR, NOT.

Первый этап вычисления логического выражения может состоять в построении двоичного дерева операций. Все логические операции (кроме операции НЕ) являются бинарными, могут представить любое логическое выражение запроса в виде несбалансированного двоичного дерева, прохождение по которому снизу вверх приводит к получению результата. В узлах такого дерева, включая корневую вершину, расположены логические операции (oi), а листья (конечные узлы) представляют собой строки матрицы L0, соответствующие терминам запроса ().

Будем называть операндом запроса отдельно вычисляемое выражение, соответствующее поддереву запроса.

Рассмотрим расширенную матрицу «термин-документ» L0, строки которой могут представлять собой не только показатели встречаемости терминов в документах информационного массива, но и результирующие векторы запросов (Qi)

, где ,D- словарь.

K – количество включенных в матрицу результирующих векторов запросов,

Поставим в соответствие каждой логической операции правило ее выполнения с использованием расширенной матрицы:гдеиз множества бинарных логических операций:Для унарной операции NOT это правило реализуется следующим образом:

Тогда алгоритм разрешения двоичного дерева поискового запроса состоит в последовательном выполнении снизу вверх логических операций и в пополнении на каждом шаге матрицы L0 очередной строкой-результатом.

Условием выполнения k-той операции служит наличие в матрице строк, соотв-щих правому и левому операнду. После выполнения k-той операции формируется результирующий вектор, который становится ()-й строкой матрицы.

  1. Линейная модель механизма поиска документов-аналогов.

Аналоги документа- документы, имеющие заданное количество общих терминов с исходными документами.

Выделим в матрице L0 столбец , соответствующий поисковому образу документа (ПОД) рассматриваемого документа, и построим подматрицу Ldoc, оставив в матрице L0 те строки, в которых . По матрице Ldoc строится результирующий вектор запроса на поиск аналогов (Qdoc ) и м.б. получен поисковый результат с учетом (или без) некоторого заданного порога «близости» (m).

Когда универсальный словарь представляет собой набор отдельных словарей Di, построенных по лексике отдельных структурных единиц документов (например, полей), процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц и построением логического выражения над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.

Рассмотрим реализацию процедуры поиска аналогов для случая:

, Тогда ПОД заданного документа представляет собой объединение ПОДов, построенных для различных структурных единиц:, а подматрица аналогов - соединение подматриц:(,…,)’

Построим матрицу результирующих векторов , где каждая строка представляет собой результирующий вектор одной из подматриц с учетом заданного порога близости:

Используя матрицу вместо матрицы L0 в модели поиска по логическому выражению, можно выполнять процедуры построения дерева запроса с последовательным вычислением результата.