Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы_ИС1.doc
Скачиваний:
24
Добавлен:
18.07.2019
Размер:
444.93 Кб
Скачать
  1. Документальные информационные системы

Документальной информационной системы — единое хранилище документов с инструментарием поиска и отбора необходимых документов.Предназначены для обработки неструктурированной информации.

Основная задача документальных информационных систем: хранение, накопление и предоставление пользователю документов, содержание, тематика, реквизиты которых соответствуют его информационным потребностям.

Цель системы – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям.

З апрос – ПОЗ (поиск образцового значения) ПОД (поиск образцового документа) Документ

Логический комплекс ДИС включает в себя три основных блока:

- один или несколько информационно-поисковых языков (ИПЯ)

- систему индексирования

- поисковый аппарат

Применение естественного языка для описания поисковых образов документов запросов не позволяет обеспечить однозначность содержания из-за наличия синонимов, а так же затрудняет машинную обработку. Поэтому в ДИС используются ИПЯ (формализованная система, обеспечивающая описание содержания документа или запроса для дальнейшего содержания. Дескриптор – обобщающий термин для группы ключевых слов (должен соответствовать тезаурусу – словарю понятий). Индексированием называется процедура получения поискового образа документа или запроса. Состоит процедура индексирования в переводе содержания документа с естественного языка на ИПЯ. Поисковый аппарат представляет собой алгоритм сопоставления поисковых образов документов и запросов.

  1. Информационно–поисковые языки.

    Информационный поиск - в широком смысле - последовательность операций, направленных на предоставление информации заинтересованным лицам. В общем случае информационный поиск состоит из четырех этапов:

1- уточнение информационной потребности и формулировка запроса; 2- определение совокупности держателей информационных массивов; 3- извлечение информации из информационных массивов; 4- ознакомление пользователя с полученной информацией и оценка результатов поиска.

Информационно-поисковый язык – это язык, обеспечивающий передачу (запись) содержания документа в объеме, необходимом для цели поиска.

Информационно-поисковый язык представляет собой некоторую формализованную семантическую систему, предназначенную для выражения содержания документа и поискового запроса.

Основные задачи:

  • Перевод содержания документа в ПОД (поисковый образ документа)

  • Перевод содержания запроса пользователя

Элементы простейших ИПЯ:

  • Слова

  • Морфология

  • Словарь перевода

  • Синтаксис (ключевое слово + дескриптор // дескриптор – это обобщающий термин для отображения группы синонимов, которые используются в процессе поиска в ИПЯ)

ИПЯ классификационного типа основаны на иерархической или фасетной классификации документов. Например универсальная десятичная классификация (УДК), предполагающая деление всей информации на 10 классов, каждый из которых делится на 10 подклассов и т.д.

Классификация документов позволяет составлять их каталоги (рубрики) для локализации поиска.

ИПЯ дескрипторного типа основаны на описании содержания документов с помощью дескрипторов – ключевых слов, отражающих смысл данного документа.

Дескриптор – это обобщающий термин для группы ключевых слов – синонимов. Дескриптор должен соответствовать тезариусу (словарю понятий), принятому в данном ИПЯ.

Простейшим ПОД может быть заглавие документа, переписанное в виде перечня находящихся в нем слов. Слова ставятся в начальной форме, предлоги и союзы отсутствуют.

В ИПЯ с грамматикой дескрипторы связываются в логические выражения, например, с помощью булевых операторов AND, OR, NOT.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]