
- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •Рассеяние- вытекет из межотраслевого характера информации.Означает, что инф-я, полезная для решения данной проблемы, может оказатся в документах, которые относятся к другой предметной области.
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •Объект1 - материальная или не материальная сущность мира. Примерами объектов могут служить персоны, некоторые предметы или их части, явления, события или процессы, с ними связанные.
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •6. Модель процесса генерации знания в рамках общей теории систем.
- •7.Соотношение понятий «данные», «информация», «знания».
- •8.Модель процесса информирования. Типовые схемы информирования.
- •9. Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •10. Определение ис. Организационно-функциональная структура аис
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ипс. Отличия документальных и фактографических ипс.
- •12. Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •13.Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •14.Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •15. Предкоординированные и посткоординированные информационно-поисковые языки.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис. Кодирование информации
- •17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Кластерная – отражает особенности перечислительного способа.
- •22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •24.Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Ключ, идентифицирующий группу записей – вторичный. Сцепленный ключ – состоящий из нескольких элементов данных.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа
- •Надо: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •Идея: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •29. Линейная модель механизма поиска по совпадению терминов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
- •36. Основные частные и интегральные критерии оценки аипс.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики аипс.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ис.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
Любое состояние объекта характеризуется набором атрибутов, имеющих значения в этот момент времени. Записываются они в виде записи – совокупности формализованных элементов данных. В контексте задач поиска можно сказать, что значение атрибута идентифицирует объект (можно использовать значение атрибута в качестве поискового признака).
Фактографические данные можно непосредственно интерпретировать (без дополнительных комментариев).
При этом способ идентификации данных через атрибуты плохо подходит для слабо структурированной информации (=связанной с объектами, имеющими умозрительную природу: категориями, понятиями, знаковыми системами). В этом случае объекты определяются опосредованно, через другие объекты, используя естественные или искусственные языки (пример – язык математики).
Ключ, идентифицирующий запись единственным образом – первичный.
Ключ, идентифицирующий группу записей – вторичный. Сцепленный ключ – состоящий из нескольких элементов данных.
Ключ может храниться и составе записи или отдельно.
Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
Вторичный ключ можно использовать, организовав инвертированный список. Каждому значению вторичного ключа будут соответствовать несколько первичных. Пример:
Вторичный ключ |
Первичный ключ |
а/м ВАЗ 2110 |
112, 456, 889 |
а/м ВАЗ 2121 |
113, 457 |
а/м ГАЗ 3102 |
998 |
А/м ГАЗ 3110 |
441, 789 |
Недостаток индекса – он занимает дополнительную память и его надо обновлять при изменении (добавлении, удалении) записей.
Инвертированный список может быть построен для любого (в т.ч. и составного) ключа.
В задачах поиска существуют два способа организации данных. Первый – прямая организация массива (сначала первичные ключи, потом вторичные), второй – инвертированный список.
Первый способ удобен для поиска по условию «каковы свойства указанного объекта?», а второй – «какие объекты обладают этим свойством?».
В [какой то книге какого то мартина] приводится такая типология простых (атомарных) запросов:
1). А(Е) = ? Каково значение атрибута А для объекта Е?
2). А(?) = V Какие объекты имеют значение атрибута равное V?
3). ?(Е) = V Какие атрибуты объекта Е имеют значение равное V?
4). ?(Е) = ? Какие значения атрибутов имеет объект Е?
5). А(?) = ? Какие значения имеет атрибут А в наборе?
6). ?(?) = V Какие атрибуты объектов набора имеют значение равное V?
В запросах типов 2, 3, 6 вместо = могут быть использованы другие операторы сравнения (>,<, не равно или другие).
Запросы типа 1 выполняются поиском по «прямому» массиву: доступ к записи производится по первичному ключу. Запросы типа 2 выполняются поиском по инвертированному списку: доступ к записи(ям) производится по указателю, выбираемому из списка по значению вторичного ключа. Ответом в этих случаях будет значение атрибута или идентификатора. Запросы типа 3 имеют ответом имя атрибута.
Запросы типа 2, 5, 6 относятся к нескольким атрибутам, и в этом случае могут быть построены несколько индексов, облегчающих поиск по этим ключам.
Для обработки запросов 2-го типа есть три типа архитектур доступа:
Системы с вторичными индексами – записи расположены в соответствии с последовательностью значений первичного ключа.
Системы частично инвертированных файлов – произвольная последовательность. Первичный индекс отсутствует.
Системы полностью инвертированных файлов – хранение значений разных элементов данных в разных файлах. Для ускорения поиска два набора индексов – индекс экземпляров (значений ключей) и индекс данных (инвертированный список). Такая организация характерна для документальных ИС.