Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Расписанные ответы на вопросы (новые).doc
Скачиваний:
58
Добавлен:
04.06.2015
Размер:
5.48 Mб
Скачать
  1. Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.

По характеру и степени соотношения в предмете поиска известного и неизвестного (как степени семантической неопределенности) можно выделить три типа поисковых задач.

  1. Предметный (или атрибутивный ) вид поиска – поиск объекта, когда известно, что этот объект существует (например, поиск фактографии или трудов конкретного автора). Поисковая модель (логическая идентификация объекта поиска) может быть представлена как поиск по атрибутам. Для документального поиска – это отбор по логическому выражению над именами понятий, задаваемыми терминами или их комбинациями.

  2. Тематический вид поиска – подбор информации по некоторой теме, например, для поиска метода решения практической задачи. Тематический поиск – это нахождение в среде ИС (информационной системы) описаний актуально существующих в ПрО (?предметной области?) основной деятельности объектов, свойства которых могут быть полностью определены на уже известном множестве атрибутов. Поисковая модель в этом случае – это поиск по части известного понятия или связям, частично задаваемым комбинацией характеристических признаков. Тематический поиск реализуется как последовательность атрибутивных поисков.

  3. Вид проблемного поиска – нахождение в ИСр (информационное среде) описаний объектов или их составляющих, потенциально существующих в ПрО ОД (основной деятельности) и в совокупности, возможно, образующих целое, свойства которого будут больше суммы свойств частей. Т.е. этим свойствам в явной форме не соответствуют «собственные» атрибуты, а новое свойство, например, может быть задано комбинацией уже известных атрибутов. Логическая поисковая модель для этого случая – поиск «похожих» документов, содержание которых некоторым образом ассоциируется с задачей пользователя.

  1. Понятие стратегии и технологии поиска. Связь стратегии и типа поисковой задачи.

Стратегия поиска - общий план (концепция, предпочтение, предрасположенность, установка) поведения пользователя для выражения и удовлетворения информационной потребности, обусловленный характером цели и типом поиска, архитектурой БД, а также методами и средствами поиска конкретной АИПС.

По способам организации доступа к информации, представленной в документальной форме, и отдавая должное истории развития ИС, можно говорить о двух типах решений, воплощаемых в промышленных АИПС.

Первые - традиционные ИПС, берущие начало от библиотечных систем, информационный вход в которых реализуется через дополнительные (вторичные по отношению к текстам документы) справочные структуры различного типа.

Вторые - гипертекстовые ИС, в которых переход к потенциально полезному документу реализуется через контекстную ссылку, размещенную в тексте самого документа. В зависимости от формы представления информационной потребности (вида запроса), можно выделить два вида поисковых стратегий.

Большинство промышленных АИПС обеспечивает поддержку традиционной вербальной стратегии, отличительной чертой которой является обязательное построение завершенного, логически и синтаксически правильного выражения, посредством которого может быть получена выдача формально релевантных запросу документов.

Другим видом стратегии является кластерная, обобщающая понятие "документ" или "совокупность документов" до уровня запроса. Подход основывается на предположении, что документ, его фрагмент или группа документов могут рассматриваться не только как результат поиска, но и как средство навигации, т.е. некоторый поисковый образ. Технологии, поддерживающие кластерные стратегии, в значительной мере позволяют сократить объем просматриваемой при поиске информации за счет определения на основе знаний пользователя групп документов для эффективной идентификации его потребностей.

Технология поиска – оптимизированная в рамках конкретной АИПС последовательность эффективного использования в процессе взаимодействия пользователя с системой отдельных средств поиска для получения устойчивого конечного и, возможно, промежуточных результатов. Технологии поиска (и как итог - получения выдачи) объединяют два процесса:

  • процесс объявления (выражения, обозначения) пользователем информационной потребности;

  • процесс построения системой информационного массива - множества документов, выдаваемых пользователю в ответ на поисковое требование.

Оптимизационная задача АИС – это минимизация совокупных временных затрат за счет снижения суммарного объема выдач, просматриваемых потребителем. Методы сокращения пространства перебора (просматриваемого подмножества) образуют методологическую основу стратегии поиска и могут быть разделены на следующие классы:

  • Методы поиска в одном пространстве

  • Методы поиска в иерархически упорядоченном пространстве

  • Методы поиска в альтернативных пространствах

  • Методы поиска в динамическом пространстве (изменяющемся в процессе поиска)

Для случая документальных ретроспективных БД наиболее актуальными являются два первых случая, где в свою очередь можно выделить следующие подклассы:

  • Поиск методом уточнения/расширения области

  • Поиск с использованием абстрактных пространств (динамически выделяемых в соответствии с некоторым фиксированным набором признаков)

  • Поиск с использованием метапространства (динамическое определение набора признаков для выделения подпространств), т.е. с переопределением метода поиска

Учитывая опосредованность процесса извлечения информации из БД, можно сказать, что практически всегда процесс выполняется в два этапа. Первый этап – автоматизированный отбор документов по формальному критерию, в той или иной степени полно и точно соответствующих информационной потребности (предпочтительно более полно, хотя и менее точно), и второй – «ручной» отбор с непосредственным просмотром.