- •Определения понятия «информации». Прагматические и атрибутивные свойства информации.
- •Свойства концентрации и рассеяния информации. Характер закономерностей.
- •Понятия «информационный объект», «информационное взаимодействие».
- •Определение понятия информации с точки зрения информационного взаимодействия.
- •Свойства информации с точки зрения модели информационного взаимодействия.
- •Модель процесса генерации знания в рамках общей теории систем.
- •Соотношение понятий «данные», «информация», «знания».
- •Модель процесса информирования. Типовые схемы информирования.
- •Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •Определение ис. Организационно-функциональная структура аис
- •Назначение и классификация информационных систем. Конкретная и абстрактная ипс.
- •Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •Предкоординированные и посткоординированные информационно-поисковые языки.
- •Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис.
- •Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •Типология информационных потребностей (когнитивная модель)
- •Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •Понятие стратегии и технологии поиска. Связь стратегии и типа поисковой задачи.
- •Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа.
- •Типы обратной связи в технологии информационного поиска.
- •Линейная модель механизма поиска по совпадению терминов.
- •Линейная модель механизма поиска по логическому выражению.
- •Линейная модель механизма поиска документов-аналогов.
- •Линейная модель механизма эвристического поиска.
- •Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •Матрицы ассоциации документов, терминов и их свойства.
- •Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
- •Основные частные и интегральные критерии оценки аипс.
- •Понятие рабочей характеристики аипс.
- •Матрицы "термин-документ", "термин-термин" и их свойства.
- •Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •Назначение, состав и структура лингвистического обеспечения ис.
- •Основные методы идентификации объектов.
- •Классификация. Определение и формально–логические правила построения.
- •Типы классификаций. Иерархические классификации. Примеры.
- •Типы классификаций. Фасетные классификации. Примеры.
- •Сравнительная характеристика иерархических и фасетных классификаций.
- •Кодирование объектов. Системы кодирования. Примеры.
- •Назначение, структура и использование информационно-поисковых тезаурусов.
- •Обобщенная технологическая схема и компоненты информационного поиска.
- •Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
Линейная модель механизма поиска по совпадению терминов.
При поиске по совпадению терминов задается требование полного или частичного совпадения. Частичное совпадение осуществляется с помощью маскирования.
Формирование поискового образа запроса (ПОЗ): выбираем из матрицы L0 строки, которые соответствуют терминам, указанным в запросе. Если термин не найден, ему ставится в соответствие строка, состоящая из нулей. Для k терминов получаем подматрицу запроса (Lq):
Построим результирующий вектор запроса:
Окончательный поисковый результат м.б. сформирован по двум правилам: документ считается формально релевантным запросу, если содержит все k терминов, или если содержит хотя бы часть (один, два, три и т.д.) из k терминов. При реализацииполучаем:
Для реализации 2-го правила зададим границу m, определяющую min-е количество терминов, необходимое для отнесения документа к релевантным документам.
Линейная модель механизма поиска по логическому выражению.
Логическое выражение-это последовательность терминов, объединенных знаками логических операций; синтаксическая конструкция языка, вычисляющая величины, которые принимают значение «0» или «1».
Логические операции: AND, OR, XOR, NOT.
Первый этап вычисления логического выражения может состоять в построении двоичного дерева операций. Все логические операции (кроме операции НЕ) являются бинарными, могут представить любое логическое выражение запроса в виде несбалансированного двоичного дерева, прохождение по которому снизу вверх приводит к получению результата. В узлах такого дерева, включая корневую вершину, расположены логические операции (oi), а листья (конечные узлы) представляют собой строки матрицы L0, соответствующие терминам запроса ().
Будем называть операндом запроса отдельно вычисляемое выражение, соответствующее поддереву запроса.
Рассмотрим расширенную матрицу «термин-документ» L’0, строки которой могут представлять собой не только показатели встречаемости терминов в документах информационного массива, но и результирующие векторы запросов (Qi)
, где ,D- словарь.
K – количество включенных в матрицу результирующих векторов запросов,
Поставим в соответствие каждой логической операции правило ее выполнения с использованием расширенной матрицы:гдеиз множества бинарных логических операций:Для унарной операции NOT это правило реализуется следующим образом:
Тогда алгоритм разрешения двоичного дерева поискового запроса состоит в последовательном выполнении снизу вверх логических операций и в пополнении на каждом шаге матрицы L0 очередной строкой-результатом.
Условием выполнения k-той операции служит наличие в матрице строк, соотв-щих правому и левому операнду. После выполнения k-той операции формируется результирующий вектор, который становится ()-й строкой матрицы.
Линейная модель механизма поиска документов-аналогов.
Аналоги документа- документы, имеющие заданное количество общих терминов с исходными документами.
Выделим в матрице L0 столбец , соответствующий поисковому образу документа (ПОД) рассматриваемого документа, и построим подматрицу Ldoc, оставив в матрице L0 те строки, в которых . По матрице Ldoc строится результирующий вектор запроса на поиск аналогов (Qdoc ) и м.б. получен поисковый результат с учетом (или без) некоторого заданного порога «близости» (m).
Когда универсальный словарь представляет собой набор отдельных словарей Di, построенных по лексике отдельных структурных единиц документов (например, полей), процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц и построением логического выражения над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.
Рассмотрим реализацию процедуры поиска аналогов для случая:
, Тогда ПОД заданного документа представляет собой объединение ПОДов, построенных для различных структурных единиц:, а подматрица аналогов - соединение подматриц:(,…,)’
Построим матрицу результирующих векторов , где каждая строка представляет собой результирующий вектор одной из подматриц с учетом заданного порога близости:
Используя матрицу вместо матрицы L0 в модели поиска по логическому выражению, можно выполнять процедуры построения дерева запроса с последовательным вычислением результата.