Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTVYeT_1-19.doc
Скачиваний:
9
Добавлен:
28.08.2019
Размер:
354.82 Кб
Скачать

2. Предметная область документальных информационных систем. Информационно-поисковой язык, система индексирования, технология обработки данных, поисковой аппарат

  • Документальные информационные системы обслуживают класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги, рефераты, тексты законов) и графических объектов, снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям.

Документальные системы служат для работы с документами, написанными на словесном языке. Наиболее распространены ИНФОРМАЦИОННО ПОИСКОВЫЕ СИСТЕМЫ(выполняет функции: хранения больших объёмов информации, дополнения, изменения информации(модификации), вывода информации в удобной форме.)

(поиск идёт не по самим документам, а по их поисковым образам(индивидуальный код документа), которые содержат информацию(адрес о местонахождении документов)

В системах на основе индексирования исходные документы помещаются в базу без какого-либо дополнительного преобразования, но при этом смысловое содержание каждого документа отображается в некоторое поисковое пространство. Процесс отображения документа в поисковое пространство называется индексированием и заключается в присвоении каждому документу некоторого индекса-координаты в поисковом пространстве. Система на основе определенных критериев и способов ищет документы, поисковые образы которых соответствуют или близки поисковым образам запроса пользователя, и выдает соответствующие документы.

ИПЯ эти языки применяются для смыслового описания текста, строится на базе естественных языков и отличаются чёткими грамматическими правилами.

Все языки ИПС делятся на 2 класса

-классификационные(в них кроме простых понятий включены сложные сочетания слов, при этом каждое слово во фразе означает класс, например языки программирования, процедурные, паскаль.)

Группа связанных модификаторов называется систематизаторы

К таким системам относятся Yhoo! Rambler!

-дескрипторные (в них лексические единицы заранее не связаны текстуальными отношениями. Бывают с грамматикой и без грамматики. В языках с грамматикой существуют сложные правила построения. Например действие, субъект, объект. В языках без грамматики порядок слов значения не имеет. В дескрипторных фразы обычно строятся с использованием знаков логики(Yandex, Aport)

Дескрипторные языки могут быть с контролируемой лексикой и свободной!

Основными элементами ИПЯЯ является алфавит, лексика, грамматика.

Алфавит- это система знаков, используемых для слов в предложении

Лексика-это словарный состав ИПЯ

В качестве лексических единиц могут быть использованы

-слова

-коды и шифры

Способы создания ИПЯ

-перечисление всех лексических единиц

-перечисление части лексических единиц и заданием правила формирования из других лексических единиц

-заданием правил и единиц

Грамматика ИПЯ – совокупность средств и способов построения изменения и сочетания лексических единиц. Включает морфологию и синтаксис

Морфология – совокупность средств и способов построения слов и фраз

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]