- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •Рассеяние- вытекет из межотраслевого характера информации.Означает, что инф-я, полезная для решения данной проблемы, может оказатся в документах, которые относятся к другой предметной области.
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •Объект1 - материальная или не материальная сущность мира. Примерами объектов могут служить персоны, некоторые предметы или их части, явления, события или процессы, с ними связанные.
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •6. Модель процесса генерации знания в рамках общей теории систем.
- •7.Соотношение понятий «данные», «информация», «знания».
- •8.Модель процесса информирования. Типовые схемы информирования.
- •9. Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •10. Определение ис. Организационно-функциональная структура аис
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ипс. Отличия документальных и фактографических ипс.
- •12. Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •13.Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •14.Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •15. Предкоординированные и посткоординированные информационно-поисковые языки.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис. Кодирование информации
- •17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Кластерная – отражает особенности перечислительного способа.
- •22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •24.Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Ключ, идентифицирующий группу записей – вторичный. Сцепленный ключ – состоящий из нескольких элементов данных.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа
- •Надо: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •Идея: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •29. Линейная модель механизма поиска по совпадению терминов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
- •36. Основные частные и интегральные критерии оценки аипс.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики аипс.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ис.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
30. Линейная модель механизма поиска по логическому выражению.
Логическое выражение поискового условия – это синтаксическая конструкция языка, задающая порядок и способ вычисления величины, принимающей значение «0» или «1». Выражение представляет собой последовательность операндов, соединенных друг с другом знаками операций. Нотация Бэкуса для такого выражения следующая: <Выражение>::=<Операнд><Выражение><Операция>
<Выражение>
(<Выражение><Операция><Выражение>)
Обычно:
операнд – термин(дескриптор); операция
– одна из логических операций. Первый
этап вычисления логического выражения
может состоять в построении двоичного
дерева операций. Все логические операции
(кроме NOT)
– бинарные => можно представить любое
логическое выражение запроса в виде
несбалансированного двоичного дерева,
прохождение по которому снизу вверх
приводит к получению результата. В узлах
дерева расположены логические операции
(oi),
а листья (конечные узлы) представляют
собой строки матрицы L0,
соотвующие терминам запроса
.Операнд
запроса – отдельно вычисляемое выражение,
соответствующее поддереву запроса.
Расширенная
матрица «термин-документ»
.Строки – не
только показатели встречаемости
терминов, но и результирующие векторы
запросов (Qi).
,
где 1,K
– количество включенных в матрицу
результирующих векторов запросов,а

Поставим
в соответствие каждой логической
операции правило ее выполнения с
использованием расширенной матрицы:
где
из множества бинарных логических
операций:
Для
унарной операцииNOT
это правило реализуется следующим
образом:
Тогда
алгоритм разрешения двоичного дерева
поискового запроса состоит в
последовательном выполнении снизу
вверх логических операций и в пополнении
на каждом шаге матрицы L0
очередной строкой-результатом. Условием
выполнения k-той
операции служит наличие в матрице
строк, соответствующих правому и левому
операнду. После выполненияk-той
операции формируется результирующий
вектор
,
который становится (
)-й
строкой матрицы.
31. Линейная модель механизма поиска документов-аналогов.
Аналогами документа называются такие документы информационного массива, которые имеют заданное количество общих терминов с исходным. Задается пороговое значение близости m. Процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц документов и составлением логических выражений над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.
Выделим
в матрице L0
столбец
,
соответствующий ПОДу рассматриваемого
документа, и построим подматрицуLDoc,
оставив в матрице L0
те строки,
в кот-х
.
По матрицеLDoc
строится результирующий вектор запроса
на поиск аналогов (QDoc
) и м.б. получен поисковый результат с
учетом (или без) некоторого заданного
порога «близости» (m).
Результирующий вектор QDoc=(q1q2…qm),
где qi=
,
т.е. суммированием элементов столбца.
Далее получаем окончательный поисковый
результат Kn=(k1…km),
ki
равно либо 0 (qi<m),
документ не является аналогом,либо
1(qi>=m),
является аналогом.
32. Линейная модель механизма эвристического поиска.
Пользователь изначально указал некоторое множество релевантных документов.
Шаг 1. Построение словника терминов по множеству релевантных документов. Т.е. строится матрица LRel.
Шаг 2. Оценка терминов словника и построение Поискового Образа Темы (ПОТ).
Результатом оценивания должно быть выделение тех терминов, которые могут быть включены в ПОТ. Рекомендованный способ отбора терминов: точность термина (=частота термина в множестве релевантных документов/частота термина в информационном массиве) должна превышать параметр, вычисляемый как 1/ nS. Эвристический параметр nS характеризует число ожидаемых документов.
Шаг
3.
Построение матрицы «термин-документ»
(получается вычеркиванием строк терминов,
которые не попали в ПОТ).
,
гдеM
– количество терминов в ПОТ, определяющее
порог «близости» для следующего шага,
n
– число релевантных документов.
//Столбец-термин, строка-документ
Шаг 4. Поиск аналогов с пороговым значением M. По матрице «термин-документ» формируется поисковый результат с учетом порога близости M. Если число документов полученного результата меньше, чем заданное в системе nS, то пороговое значение M уменьшается на 1, и повторяется процедура поиска аналогов с новым пороговым значением. Таким образом, на каждой i-ой итерации пороговое значение равно M–i.
Цикл заканчивается: либо после выполнения очередной итерации число документов результата стало равно или превысило значение nS , либо пороговое значение стало равно 0.
