- •Определения понятия «информации». Прагматические и атрибутивные свойства информации.
- •Свойства концентрации и рассеяния информации. Характер закономерностей.
- •Понятия «информационный объект», «информационное взаимодействие».
- •Определение понятия информации с точки зрения информационного взаимодействия.
- •Свойства информации с точки зрения модели информационного взаимодействия.
- •Модель процесса генерации знания в рамках общей теории систем.
- •Соотношение понятий «данные», «информация», «знания».
- •Модель процесса информирования. Типовые схемы информирования.
- •Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •Определение ис. Организационно-функциональная структура аис
- •Назначение и классификация информационных систем. Конкретная и абстрактная ипс.
- •Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •Предкоординированные и посткоординированные информационно-поисковые языки.
- •Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис.
- •Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •Типология информационных потребностей (когнитивная модель)
- •Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •Понятие стратегии и технологии поиска. Связь стратегии и типа поисковой задачи.
- •Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа.
- •Типы обратной связи в технологии информационного поиска.
- •Линейная модель механизма поиска по совпадению терминов.
- •Линейная модель механизма поиска по логическому выражению.
- •Линейная модель механизма поиска документов-аналогов.
- •Линейная модель механизма эвристического поиска.
- •Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •Матрицы ассоциации документов, терминов и их свойства.
- •Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
- •Основные частные и интегральные критерии оценки аипс.
- •Понятие рабочей характеристики аипс.
- •Матрицы "термин-документ", "термин-термин" и их свойства.
- •Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •Назначение, состав и структура лингвистического обеспечения ис.
- •Основные методы идентификации объектов.
- •Классификация. Определение и формально–логические правила построения.
- •Типы классификаций. Иерархические классификации. Примеры.
- •Типы классификаций. Фасетные классификации. Примеры.
- •Сравнительная характеристика иерархических и фасетных классификаций.
- •Кодирование объектов. Системы кодирования. Примеры.
- •Назначение, структура и использование информационно-поисковых тезаурусов.
- •Обобщенная технологическая схема и компоненты информационного поиска.
- •Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
Матрицы ассоциации документов, терминов и их свойства.
Используем понятие универсального словаря D (прообразом которого может быть, например, тезаурус, рубрикатор), содержавшего множество лексических единиц всего потока документов.
li – совокупность лексических единиц некоторого документа (сообщения), который является элементом некоторого потока L:
Аналогично универсальному словарю введём понятие универсально массива L0 (прообразы – поисковый массив ИПС, отраслевой справочно-информационный фонд, массив библиотеки), подмножеством которого являются все документы:
Где n0 – мощность множества L0.
Линейное представление теоретико-множественного образа документа:
Универсальный массив в линейном представлении есть матрица размерности D*n0:
Подобные матрицы – матрицы «термин-документ». Каждый столбец соответствует документу и описывает множество терминов, содержащихся в нём.
Строка соответствует отдельному термину и является перечнем документов, содержащих данный термин.
Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ипс.
При комплексной оценке учитываются два вида критериев:
экономический – денежные и временные затраты, необходимые для выполнения задачи
технический – способность обеспечить потребителям требуемый уровень информационного обслуживания
Существует анализ экономической эффективности затрат и анализ соотношения затраты - выигрыш.
Экономическая эффективность затрат- поиск недорогих методов выполнения заданного набора операций или получение максимальных результатов при данных затратах.
Анализ соотношения затраты-выигрыш – систематическое сравнение стоимости выполнения отдельных операций и выигрыша, получаемого в результате их выполнения.
Анализ эффективности затрат должен основываться:
Четко определенные цели
Для достижения целей должны быть предусмотрены альтернативы
Определена стоимость альтернатив
Создание модели для связи целей и альтернатив
Ранжирование альтернатив путем оценки затрат и ожидаемой эффективности
Когда задан объем работы, основные альтернативы и выбор вариантов относятся к операциям индексирования и ввода документов, а также к процессам поиска и вывода информации.
Каждый критерий качества может достигаться многими различными способами, каждый из которых требует своего уровня затрат (например, точность можно повысить использованием специфичного языка индексирования).
Техническая эффективность. В этом вопросе существует 2 точки зрения-пользователя и администратора.
Оценки технической эффективности, интересующие пользователей:
полнота поиска – способность выдавать все релевантные документы
точность поиска – способность отбрасывать все нерелевантые документы
усилия – на формулирование запросов и просмотр выданной информации
время поиска
форма представления выдачи (вопросы интерфейса)
полнота информационного массива- степень охвата всех релевантных документов
Методика измерения показателей эффективности:
затраты труда пользователей выражается через время, необходимое на формулирвоание запроса и тд
время реакции системы
форму представления выдачи оценивают в процентном отношении к полному тексту
Оценку степени соответствия (охвата) документов БД информационной потребности делать сложно, т.к. чаще всего заранее неизвестно общее количество материалов, представляющих интерес в данной предметной области. По этой же причине показатели полноты и точности отражают реальное положение условно, это затрудняет их практическое использование при проведении поиска.
Первичные координаты описания выхода ИПС, представляющие соотношение множеств выданных и невыданных документов:
Диаграмма <L> - соотношение множеств L0-всего информационного потока, Lи- множество истинно релевантных документов и Lc- множество документов, выданных системой в ответ на поисковый запрос.
Таблица сопряженности <a,b,c,d> отображает количественное соотношение выданных системой множеств релевантных и нерелевантных документов и невыданных множеств релевантных и нерелевантных документов.
Диаграмма <n,x> -сочетание числа выданных релевантных (х) и всего выданных (n) документов.