Линейная модель механизма поиска по совпадению терминов.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Расписанные ответы на вопросы (новые).doc

Скачиваний:

Добавлен:

04.06.2015

Размер:

5.48 Mб

Скачать

☆

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 2615 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Линейная модель механизма поиска по совпадению терминов.

При поиске по совпадению терминов задается требование полного или частичного совпадения. Частичное совпадение осуществляется с помощью маскирования.

Формирование поискового образа запроса (ПОЗ): выбираем из матрицы L₀ строки, которые соответствуют терминам, указанным в запросе. Если термин не найден, ему ставится в соответствие строка, состоящая из нулей. Для k терминов получаем подматрицу запроса (Lq):

Построим результирующий вектор запроса:

Окончательный поисковый результат м.б. сформирован по двум правилам: документ считается формально релевантным запросу, если содержит все k терминов, или если содержит хотя бы часть (один, два, три и т.д.) из k терминов. При реализацииполучаем:

Для реализации 2-го правила зададим границу m, определяющую min-е количество терминов, необходимое для отнесения документа к релевантным документам.

Линейная модель механизма поиска по логическому выражению.

Логическое выражение-это последовательность терминов, объединенных знаками логических операций; синтаксическая конструкция языка, вычисляющая величины, которые принимают значение «0» или «1».

Логические операции: AND, OR, XOR, NOT.

Первый этап вычисления логического выражения может состоять в построении двоичного дерева операций. Все логические операции (кроме операции НЕ) являются бинарными, могут представить любое логическое выражение запроса в виде несбалансированного двоичного дерева, прохождение по которому снизу вверх приводит к получению результата. В узлах такого дерева, включая корневую вершину, расположены логические операции (o_i), а листья (конечные узлы) представляют собой строки матрицы L₀, соответствующие терминам запроса ().

Будем называть операндом запроса отдельно вычисляемое выражение, соответствующее поддереву запроса.

Рассмотрим расширенную матрицу «термин-документ» L^’₀, строки которой могут представлять собой не только показатели встречаемости терминов в документах информационного массива, но и результирующие векторы запросов (Qi)

, где ,D- словарь.

K – количество включенных в матрицу результирующих векторов запросов,

Поставим в соответствие каждой логической операции правило ее выполнения с использованием расширенной матрицы:гдеиз множества бинарных логических операций:Для унарной операции NOT это правило реализуется следующим образом:

Тогда алгоритм разрешения двоичного дерева поискового запроса состоит в последовательном выполнении снизу вверх логических операций и в пополнении на каждом шаге матрицы L₀ очередной строкой-результатом.

Условием выполнения k-той операции служит наличие в матрице строк, соотв-щих правому и левому операнду. После выполнения k-той операции формируется результирующий вектор, который становится ()-й строкой матрицы.

Линейная модель механизма поиска документов-аналогов.

Аналоги документа- документы, имеющие заданное количество общих терминов с исходными документами.

Выделим в матрице L₀ столбец , соответствующий поисковому образу документа (ПОД) рассматриваемого документа, и построим подматрицу L_doc, оставив в матрице L₀ те строки, в которых . По матрице L_doc строится результирующий вектор запроса на поиск аналогов (Q_doc ) и м.б. получен поисковый результат с учетом (или без) некоторого заданного порога «близости» (m).

Когда универсальный словарь представляет собой набор отдельных словарей D_i, построенных по лексике отдельных структурных единиц документов (например, полей), процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц и построением логического выражения над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.

Рассмотрим реализацию процедуры поиска аналогов для случая:

, Тогда ПОД заданного документа представляет собой объединение ПОДов, построенных для различных структурных единиц:, а подматрица аналогов - соединение подматриц:(,…,)’

Построим матрицу результирующих векторов , где каждая строка представляет собой результирующий вектор одной из подматриц с учетом заданного порога близости:

Используя матрицу вместо матрицы L₀ в модели поиска по логическому выражению, можно выполнять процедуры построения дерева запроса с последовательным вычислением результата.

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 2615 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
07.05.2019452.61 Кб0Рабочая тетрадь_часть1.doc
#
04.06.2015198.66 Кб3РабПрогДискрМатемИТ-веч(4 семестр)210100 нов.doc
#
27.08.2019135.17 Кб10Радиационный фон Земли.doc
#
26.08.201989.6 Кб11Развитие социологии в России.doc
#
25.09.201927.84 Кб0РАЗДЕЛ 11-12.docx
#
04.06.20155.48 Mб58Расписанные ответы на вопросы (новые).doc
#
05.06.20151.82 Mб32Расписанные ответы на вопросы (новые).pdf
#
04.06.201531.38 Кб19рассказ к презентации.docx
#
05.06.20153.98 Mб49расчёт червячной передачи.rtf
#
04.06.2015687.1 Кб23Расчетная работа№2 по векторной алгебре.doc
#
30.08.20191.83 Mб5Рафу ппшт.doc

Линейная модель механизма поиска по совпадению терминов.

Линейная модель механизма поиска по логическому выражению.

Линейная модель механизма поиска документов-аналогов.