- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •Рассеяние- вытекет из межотраслевого характера информации.Означает, что инф-я, полезная для решения данной проблемы, может оказатся в документах, которые относятся к другой предметной области.
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •Объект1 - материальная или не материальная сущность мира. Примерами объектов могут служить персоны, некоторые предметы или их части, явления, события или процессы, с ними связанные.
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •6. Модель процесса генерации знания в рамках общей теории систем.
- •7.Соотношение понятий «данные», «информация», «знания».
- •8.Модель процесса информирования. Типовые схемы информирования.
- •9. Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •10. Определение ис. Организационно-функциональная структура аис
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ипс. Отличия документальных и фактографических ипс.
- •12. Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •13.Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •14.Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •15. Предкоординированные и посткоординированные информационно-поисковые языки.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис. Кодирование информации
- •17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Кластерная – отражает особенности перечислительного способа.
- •22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •24.Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Ключ, идентифицирующий группу записей – вторичный. Сцепленный ключ – состоящий из нескольких элементов данных.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа
- •Надо: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •Идея: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •29. Линейная модель механизма поиска по совпадению терминов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
- •36. Основные частные и интегральные критерии оценки аипс.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики аипс.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ис.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
Логическое выражение поискового условия (запроса) – это синтаксическая конструкция языка, задающая порядок и способ вычисления величины, принимающей значение «0» или «1» В соответствии с правилами оно представляет собой последовательность операндов, соединенных друг с другом знаками операций. Фрагменты выражения можно заключать в скобки.
Нотация Бэкуса для такого выражения следующая:
<Выражение>::=<Операнд>|<Выражение><Операция>
<Выражение>|(<Выражение><Операция><Выражение>)
В качестве операнда в поисковом выражении выступают термины (дескрипторы), а в качестве операции – одна из логических операций AND, OR, XOR и NOT.
Оператор критерия задаёт условие включения или сравнения дескрипторов запроса и терминов, содержащихся в указанных полях документов.
«=» EQ – позволяет найти документы, для которых указанная область поиска равна результату вычисления выражения условия.
«<>» NE – позволяет найти документы, которые не содержат в указанной области поиска результат вычисления выражения условия
«>» GT – позволяет найти документы, которые содержат в указанной области поиска значения большие, чем результат вычисления выражения условия
«>=» GE - …. Значения большие или равные результату вычисления выражения условия
«<» LT - ….. значения меньшие, чем результат вычисления выражения условия
«<=» LE - …. Значения меньшие или равные результату вычисления выражения условия.
Контекстные операторы
<дескриптор1>оператор<дескриптор2>
CTR[N] - позволяет найти документы, в заданной области поиска которых в одном предложении присутствуют поисковые дескрипторы, расположенные в указанном порядке на расстоянии не более N слов друг от друга
NEAR[N] – …… на расстоянии не более N слов друг от друга
SENT[N] - …. Находящиеся в одном предложении
CON[N] - … в ИПС IRBIS включён оператор пересечения полей, служащий для отбора документов, в заданных полях которых имеется не менее N одинаковых поисковых терминов
<имя поля1> CON[N] <имя поля2>
N от 1 до 255!
27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа
ПО ЖЕЛАНИЮ для понимания: поиск – это процесс, в ходе которого происходит соотнесение искомого с каждым объектом, хранящимся в массиве. Причем:
1) сравниваются не сами объекты, а описания - так называемые «поисковые образы»;
2) сам процесс является сложным (составным и не одноактным) и обычно реализуется последовательностью операций. Алгоритм поиска включает, по крайней мере (необходимо), следующие операции:
- выборку очередного объекта из массива для выполнения сравнения с запрашиваемым;
- сравнение выбранного объекта с образцом;
- принятие решения на уровне двузначной логики «соответствует» / «не соответствует»;
- переход к выборке следующего объекта или завершение процесса поиска.
Различают два вида поиска информации – поиск целостного объекта и поиск по содержанию. Различие в том, что будет результатом процесса поиска в целом – документ или конкретная информация.
Надо: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
В случае прямой организации массива документы размещаются в последовательности, не связываемой с порядком какой-либо классификации или алфавита. Поиск по предмету при такой организации для больших массивов будет требовать достаточно много времени, так как для этого надо последовательно выбирать для сравнения с запросом все документы из хранилища.
В инвертированном массиве документы могут быть разбиты на подмножества, которые упорядочены в соответствии с некоторой классификацией и обозначены идентификаторами, отражающими предметное содержание соответствующего класса. При этом так же создается инвертированный справочник, в котором с каждым индексом связан список ссылок на документы, отнесенные к этому классу.
Выгода: При поиске мы ищем уже не во всех документах, а в тех которые указаны в справочнике для класса, к которому отнесен наш запрос. Длина индекса обычно на несколько порядков меньше длины документа, индексы строго упорядочены. В итоге большой выигрыш по времени поиска.
Индексирования имеет ряд недостатков:
1) индексационная информация статична: индексы, приписанные к документу, будут всегда иметь смысл, определенный при создании языка индексирования;
2) нельзя без дополнительных затрат реализовать управление глубиной поиска, а также поиск с использованием критерия «частичного» соответствия.
Запрос обычно представляется как набор атрибутов. Атрибуты могут быть представлены в ключевой или позиционной форме.
Позиционная форма - табличный способ: каждому атрибуту соответствует колонка, каждая ячейка которой содержит значение атрибута.
Ключевая форма – имя атрибута = значение. В документальных системах, в которых поисковые образы представлены набором дескрипторов, атрибут задается предикатом «поисковый образ имеет в составе дескриптор». Сам дескриптор является значением атрибута.
Дескрипторы – это ключевые слова, которые по определенным правилам отобраны из основного словарного состава языка и у которых искусственно устранены синонимия, полисемия и омонимия.