Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[7 семестр] Расписанные вопросы к экзамену.pdf
Скачиваний:
8
Добавлен:
05.06.2015
Размер:
1.52 Mб
Скачать

32. Линейная модель механизма эвристического поиска.

Пользователь изначально указал некоторое множество релевантных документов.

Шаг 1. Построение словника терминов по множеству релевантных документов. Т.е. строится матрица LRel.

Шаг 2. Оценка терминов словника и построение Поискового Образа Темы

(ПОТ).

Результатом оценивания должно быть выделение тех терминов, которые могут быть включены в ПОТ. Рекомендованный способ отбора терминов: точность термина (=частота термина в множестве релевантных документов/частота термина в информационном массиве) должна превышать параметр, вычисляемый как 1/ nS. Эвристический параметр nS характеризует число ожидаемых документов.

Шаг 3. Построение матрицы «термин-документ» (получается вычеркиванием строк терминов, которые не попали в ПОТ).

L ПОТ

   

b

,i 1,M ,k

ij

 

k

 

1,n

    

, где M – количество терминов в ПОТ,

определяющее порог «близости» для следующего шага, n – число релевантных документов. //Столбец-термин, строка-документ

Шаг 4. Поиск аналогов с пороговым значением M. По матрице «терминдокумент» формируется поисковый результат с учетом порога близости M. Если число документов полученного результата меньше, чем заданное в системе nS, то пороговое значение M уменьшается на 1, и повторяется процедура поиска аналогов с новым пороговым значением. Таким образом, на каждой i-ой итерации пороговое значение равно M–i.

Цикл заканчивается: либо после выполнения очередной итерации число документов результата стало равно или превысило значение nS , либо пороговое значение стало равно 0.

33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.

Обратная связь по релевантности терминов должна обеспечить пользователю возможность целенаправленно изменять поисковый запрос путем повышения роли одних и понижения роли других терминов. Рассмотрим диалоговую модель механизма поиска по обратной связи, предлагаемую в ИПС IRBIS. Она отличается от модели эвристического поиска тем, что после выполнения системой очередного шага пользователю предоставляется возможность управлять дальнейшим процессом формирования результата

Шаг 1. Построение и ранжирование словника релевантных документов.

Рез-том этого шага является вектор W wi,i 1,k , где k – количество терминов релевантных документов, а wi - значение весового коэффициента

для i-го термина, удовлетворяющее неравенству

w w

.

i

i 1

 

 

По завершении первого шага система передает управление пользователю, который самостоятельно отмечает термины, способные улучшить поисковый запрос.

Отмеченные термины пользователь могут самостоятельно добавить в поисковый запрос (для реализации моделей поиска по совпадению терминов или по логическому выражению) или инициировать второй шаг поиска по обратной связи.

Шаг 2. Формирование матрицы поисковых результатов.

Термины, отобранные пользователем на предыдущем шаге, рассматриваются как исходные для проведения поиска по совпадению терминов. Модель этого механизма поиска реализована построением подматрицы запроса (Lq), в которой отдельные строки могут быть нулевыми. Рассмотрим подматрицу Lq как исходную для проведения процедуры поиска аналогов и последовательно для каждого ненулевого столбца построим вектор Qi – результат поиска аналогов с max-ым порогом близости (задается количеством единиц в столбце, а контекст результата задается перечислением самих терминов). Полученные векторы рассмотрим как строки матрицы поисковых результатов:

Q qij,i 1,n, j 1,n ,где n – количество ненулевых столбцов

Theme 0

подматрицы Lq.

Каждая строка матрицы снабжается контекстом-перечислением конкретных терминов, присутствующих в документах конкретного результата. Матрица

результатов дает возможность просматривать каждый отдельный результат, что позволяет формировать новое множество релевантных документов.