Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

[7 семестр] Расписанные вопросы к экзамену.docx

Скачиваний:

Добавлен:

04.06.2015

Размер:

879.86 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2416 17 18 19 20 21 22 23 24 > Следующая >>>

33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.

Обратная связь по релевантности терминов должна обеспечить пользователю возможность целенаправленно изменять поисковый запрос путем повышения роли одних и понижения роли других терминов.

Рассмотрим диалоговую модель механизма поиска по обратной связи, предлагаемую в ИПС IRBIS. Она отличается от модели эвристического поиска тем, что после выполнения системой очередного шага пользователю предоставляется возможность управлять дальнейшим процессом формирования результата

Шаг 1. Построение и ранжирование словника релевантных документов.

Рез-том этого шага является вектор где k – количество терминов релевантных документов, а w_i - значение весового коэффициента для i-го термина, удовлетворяющее неравенству .

По завершении первого шага система передает управление пользователю, который самостоятельно отмечает термины, способные улучшить поисковый запрос.

Отмеченные термины пользователь могут самостоятельно добавить в поисковый запрос (для реализации моделей поиска по совпадению терминов или по логическому выражению) или инициировать второй шаг поиска по обратной связи.

Шаг 2. Формирование матрицы поисковых результатов.

Термины, отобранные пользователем на предыдущем шаге, рассматриваются как исходные для проведения поиска по совпадению терминов. Модель этого механизма поиска реализована построением подматрицы запроса (L_q), в которой отдельные строки могут быть нулевыми.

Рассмотрим подматрицу L_q как исходную для проведения процедуры поиска аналогов и последовательно для каждого ненулевого столбца построим вектор Q_i – результат поиска аналогов с max-ым порогом близости (задается количеством единиц в столбце, а контекст результата задается перечислением самих терминов). Полученные векторы рассмотрим как строки матрицы поисковых результатов:

,где n – количество ненулевых столбцов подматрицы L_q.

Каждая строка матрицы снабжается контекстом-перечислением конкретных терминов, присутствующих в документах конкретного результата. Матрица результатов дает возможность просматривать каждый отдельный результат, что позволяет формировать новое множество релевантных документов.

34.Матрицы ассоциации документов, терминов и их свойства.

Используем понятие универсального словаря D (прообразом которого может быть, например, тезаурус, рубрикатор), содержащего множество лексических единиц всего потока документов (то есть все слова, числа и прочие обозначения, использованные во всех документах системы). Таким образом, li принадлежит D для всех i, где li— совокупность лексических единиц некоторого документа (сообщения), который является элементом некоторого потока L: L={l1 ,...,li,..., ln}, li L для всех i

Универсальный массив L₀ (ИМЕТЬ В ВИДУ, НО ЛУЧШЕ НЕ ПИСАТЬ: прообразы — поисковый массив ИПС, отраслевой справочно-информационный фонд, массив библиотеки), подмножеством которого являются все документы:

L₀ = {l1 ,...,li,..., l n₀}, li L₀ для всех i, причем | L₀| = n₀, где n₀, — мощность множества L₀. Линейное представление теоретико-множественного образа документа:

l_k=, гдеb_ik= 1-если i-й термин входит в k-й документ;0- если не входит.

Универсальный массив в линейном представлении есть матрица размерности D х n₀ :

Подобные матрицы известны под названием матрицы «термин—документ». Каждый столбец матрицы соответствует документу и описывает множество терминов, содержащихся в нем.Таким образом, столбец матрицы характеризует ПОД. Строка матрицы соответствует отдельному термину и является перечнем документов, содержащих данный термин. Сумма элементов строки представляет собой частотную характеристику термина: F_i=∑b_ik.

Составим матрицу , где.Матрицаимеет размерность. Внедиагональный элементесть количество появленийi-го и j-го терминов в , диагональный –i-го. Матрицы такого типа называют «матрица термин-термин» и характеризуют взаимосвязь терминов в данном массиве.

Составим матрицу L₀^T x L0 = (δ_km), δ_km=. Размерность n₀ x n₀, внедиагональные элементы характеризуют степень попарных пересечений сообщений из L₀:

Диагональные элементы задают длины сообщений:

В целом задает распределения пересечений документов и их длин.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2416 17 18 19 20 21 22 23 24 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
04.06.2015291.33 Кб14zapiska_2011.doc
#
27.03.2016918.46 Кб43Zhuravleva_Sbornik_dopolnitelnyh_grammaticheskih_2014.pdf
#
05.06.20153.11 Mб9ZinovyevBook.pdf
#
05.06.20152.61 Mб244zverkoff_otvet.pdf
#
05.06.2015263.06 Кб23[7 семестр] SAP (2014). Вопросы к зачёту.pdf
#
04.06.2015879.86 Кб22[7 семестр] Расписанные вопросы к экзамену.docx
#
05.06.20151.52 Mб10[7 семестр] Расписанные вопросы к экзамену.pdf
#
04.06.201594.72 Кб69_ДЗ№3.docx
#
21.11.201954.27 Кб11_ОИБ (2 к) л-3.doc
#
21.11.201974.75 Кб15_ОИБ (2 к) л-4.doc
#
25.11.201972.7 Кб7_ОИБ (2 к) л-6.doc