
- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •Рассеяние- вытекет из межотраслевого характера информации.Означает, что инф-я, полезная для решения данной проблемы, может оказатся в документах, которые относятся к другой предметной области.
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •Объект1 - материальная или не материальная сущность мира. Примерами объектов могут служить персоны, некоторые предметы или их части, явления, события или процессы, с ними связанные.
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •6. Модель процесса генерации знания в рамках общей теории систем.
- •7.Соотношение понятий «данные», «информация», «знания».
- •8.Модель процесса информирования. Типовые схемы информирования.
- •9. Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •10. Определение ис. Организационно-функциональная структура аис
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ипс. Отличия документальных и фактографических ипс.
- •12. Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •13.Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •14.Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •15. Предкоординированные и посткоординированные информационно-поисковые языки.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис. Кодирование информации
- •17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Кластерная – отражает особенности перечислительного способа.
- •22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •24.Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Ключ, идентифицирующий группу записей – вторичный. Сцепленный ключ – состоящий из нескольких элементов данных.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа
- •Надо: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •Идея: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •29. Линейная модель механизма поиска по совпадению терминов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
- •36. Основные частные и интегральные критерии оценки аипс.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики аипс.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ис.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
Обратная связь по релевантности терминов должна обеспечить пользователю возможность целенаправленно изменять поисковый запрос путем повышения роли одних и понижения роли других терминов.
Рассмотрим диалоговую модель механизма поиска по обратной связи, предлагаемую в ИПС IRBIS. Она отличается от модели эвристического поиска тем, что после выполнения системой очередного шага пользователю предоставляется возможность управлять дальнейшим процессом формирования результата
Шаг 1. Построение и ранжирование словника релевантных документов.
Рез-том
этого шага является вектор
где k – количество терминов релевантных
документов, а wi
- значение весового коэффициента для
i-го термина, удовлетворяющее неравенству
.
По завершении первого шага система передает управление пользователю, который самостоятельно отмечает термины, способные улучшить поисковый запрос.
Отмеченные термины пользователь могут самостоятельно добавить в поисковый запрос (для реализации моделей поиска по совпадению терминов или по логическому выражению) или инициировать второй шаг поиска по обратной связи.
Шаг 2. Формирование матрицы поисковых результатов.
Термины, отобранные пользователем на предыдущем шаге, рассматриваются как исходные для проведения поиска по совпадению терминов. Модель этого механизма поиска реализована построением подматрицы запроса (Lq), в которой отдельные строки могут быть нулевыми.
Рассмотрим подматрицу Lq как исходную для проведения процедуры поиска аналогов и последовательно для каждого ненулевого столбца построим вектор Qi – результат поиска аналогов с max-ым порогом близости (задается количеством единиц в столбце, а контекст результата задается перечислением самих терминов). Полученные векторы рассмотрим как строки матрицы поисковых результатов:
,где
n – количество ненулевых столбцов
подматрицы Lq.
Каждая строка матрицы снабжается контекстом-перечислением конкретных терминов, присутствующих в документах конкретного результата. Матрица результатов дает возможность просматривать каждый отдельный результат, что позволяет формировать новое множество релевантных документов.
34.Матрицы ассоциации документов, терминов и их свойства.
Используем
понятие универсального словаря D
(прообразом
которого может быть, например, тезаурус,
рубрикатор), содержащего
множество лексических единиц всего
потока документов
(то есть все слова, числа и прочие
обозначения, использованные во всех
документах системы). Таким образом, li
принадлежит D
для всех i,
где
li—
совокупность
лексических единиц некоторого документа
(сообщения),
который является элементом некоторого
потока L:
L={l1
,...,li,...,
ln},
li
L
для
всех
i
Универсальный массив L0 (ИМЕТЬ В ВИДУ, НО ЛУЧШЕ НЕ ПИСАТЬ: прообразы — поисковый массив ИПС, отраслевой справочно-информационный фонд, массив библиотеки), подмножеством которого являются все документы:
L0
=
{l1
,...,li,...,
l
n0},
li
L0
для всех
i,
причем | L0|
= n0,
где
n0,
—
мощность множества L0.
Линейное представление теоретико-множественного
образа документа:
lk=, гдеbik=
1-если i-й
термин входит в k-й
документ;0- если не входит.
Универсальный массив в линейном представлении есть матрица размерности D х n0 :
Подобные матрицы известны под названием матрицы «термин—документ». Каждый столбец матрицы соответствует документу и описывает множество терминов, содержащихся в нем.Таким образом, столбец матрицы характеризует ПОД. Строка матрицы соответствует отдельному термину и является перечнем документов, содержащих данный термин. Сумма элементов строки представляет собой частотную характеристику термина: Fi=∑bik.
Составим
матрицу
,
где
.Матрица
имеет размерность
.
Внедиагональный элемент
есть
количество появленийi-го
и j-го
терминов в
,
диагональный –i-го.
Матрицы такого типа называют «матрица
термин-термин» и характеризуют взаимосвязь
терминов в данном массиве.
Составим
матрицу L0T
x
L0
= (δkm),
δkm=.
Размерность n0
x
n0,
внедиагональные элементы характеризуют
степень попарных пересечений сообщений
из L0:
Диагональные
элементы задают длины сообщений:
В целом задает распределения пересечений документов и их длин.