Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИСиИТ(ПИ-2)Лекция06.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
73.86 Кб
Скачать

5. Документальные информационные системы.

Документальные ИС (Слайд 8) – системы, предназначенные для отыскания в множестве документов тех, которые посвящены указанной в информационном запросе теме или содержат необходимые сведения.

Документальные ИС обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос.

Характерной особенностью всех документальных ИС является то, что извлечение нужной информации из документа, найденного ИС, осуществляет сам потребитель.

Цель системы, как правило, выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям. Т.е. в зависимости от цели поиска документальные ИС выдают либо библиографические описания документов, либо только адрес искомого документа, определяющий его местонахождение в хранилище.

Документальные ИС имеют дело со слабоструктурируемой информацией, представленной совокупностью документов, которые необходимо содержать в системе в целях удовлетворения информационных потребностей ее пользователей.

Предметная область таких систем – информационная база слабоструктурируемой информации.

Основные средства – информационно-поисковый язык, критерий смыслового соответствия и аппарат поиска.

Для всех БД документальных ИС, несмотря на отличия их друг от друга по мощности и гибкости поиска, существуют общие характеристики, которые позволяют отделить их от других типов баз данных:

1. Использование текстовой информации.

2. БД ДИС более объемны и могут иметь тенденцию роста из-за того, что новые записи добавляются в массив, а старые продолжают играть важную роль для исследователей.

Т.к. основной задачей ДИС является накопление и предоставление пользователю документов, содержание, тематика, реквизиты и т. п. которых адекватны его информационным потребностям, то возможно следующее определение ДИС:

документальная ИС — единое хранилище документов с инструментарием поиска и отбора необходимых документов.

Поисковый характер документальных ИС исторически определил еще одно их название — информационно-поисковые системы (ИПС) (Слайд 9) , хотя этот термин не совсем полно отражает специфику документальных ИС.

Информационно-поисковые системы (ИПС) являются наиболее распространенным видом ДС и предназначены для накопления и поиска по различным критериям документов. В состав ИПС входят:

  • программные средства,

  • поисковый массив документов,

  • средства поддержки информационного языка этой системы.

6. Информационно-поисковый язык.

6.1. Определение и основные понятия ипя.

Поисковое пространство, отображающее поисковые образы документов (ПОД) и реализующее механизмы информационного поиска документов, строится на основе языков документальных баз данных. Эти языки называются информационно-поисковыми языками (ИПЯ) (Слайд 10).

Информационно-поисковый язык - формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска.

Информационно-поисковый язык является семантической системой, обеспечивающей передачу (запись) содержания документа в объеме, необходимом для целей поиска. Задачей ИПЯ является перевод содержания документа в поисковое предписание или поисковый образ документа (при вводе документа в ИПС) и перевод содержания запросов пользователя в поисковый образ запроса (ПОЗ).

В качестве составляющих ИПЯ выделяются (Слайд 11):

  • алфавит (набор буквенных и цифровых символов);

  • слова, формируемые из алфавита с помощью морфологических правил - морфологии,

  • словарь перевода, (в котором каждому слову или осмысленной конструкции естественного языка сопоставлено слово или словосочетание ИПЯ). Словарь может иметь достаточно сложную структуру, т.е. представлять собой тезаурус (См.ниже), который может включать в себя и алфавит, и слова, и словосочетания, и более сложные конструкции.

  • правила, отражающие взаимоотношения между словами реализуются, например, с помощью текстуальных или контекстуальных отношений, или с помощью специальных правил грамматики - синтаксиса.

Словарь может состоять из ключевых слов (словосочетаний) или дескрипторов.

Под дескриптором понимается некоторый (выбранный разработчиком ИПЯ) обобщающий термин для отображения т.н. класса условной эквивалентности - группы синонимов или слов, которые для целей поиска в конкретной ИПС можно считать синонимами.