Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы учебника по АОТ.doc
Скачиваний:
39
Добавлен:
04.11.2018
Размер:
1.66 Mб
Скачать

Документальные ис.

В быту – ИПС (информационно-поисковые системы). Предметная область описывается совокупностью документов, считается, что этого достаточно для решения задач пользователя.

Важнейшую часть документа составляет текст (слабоструктурированная информация). Для решения задач (обработка, поиск и др.) требуются специальные методы и средства, отличные от методов и средств, применяемых для фактографических систем. Особенности документальных систем порождают необходимость создания специальных методик проектирования.

Существуют специальные программные средства.

Документальная система хранит документы в виде документальной БД. Особенность – единицей хранения является документ. Результатом поиска также является документ, в котором можно найти требуемую информацию.

Принцип функционирования ипс.

Автоматизированная ИС (АИС) предназначена для ввода, хранения, поиска и т.д. семантической информации. Следовательно поиск предполагает сравнение смыслового содержания документа и смыслового содержания запроса. Надо до сравнения описать это содержание, причём средства описания должны быть одинаковы и для документа, и для запроса.

Для решения этой задачи разрабатывают специальные (искусственные) языки. Вследствие обработки на таком языке получается поисковый образ запроса (ПОД) и поисковый образ документа (ПОД).

В любой док. ИС её функционирование начинается с перевода основного содержания документа и запроса с естественного языка на информационно-поисковый язык (ИПЯ). Это называется индексирование. Получаем ПОД и ПОЗ (краткая характеристика содержания) Затем осуществляется сжатие информации. ПОДы хранятся в БД – хранилище семантической информации.

Иногда производится кодирование после индексирования и информация хранится в кодовом виде.

Одна из важнейших задач – организовать наиболее эффективную форму хранения, другая – обеспечить наиболее эффективный доступ к этой информации.

Одним из наиболее популярных способов доступа – поиск. Также существуют рубрикаторы (упорядочивание информации), навигация по гиперссылкам и др. Поиск реализуется путём сопоставления ПОЗ с ПОДами, хранящимися в БД.

Важная информация – как организовать порядок сопоставления.

Информация выдаётся в виде массива документов, которые система признала релевантными запросу.

Документ – многообразный по своему наполнению объект (может содержать текстовую, цифровую, графическую, звуковую и др. информацию).

Состав аис.

Деление АИС на подсистемы неоднозначно. Критерии делния должны удовлетворять требованиям разработчиков.

  1. Функциональные подсистемы (подсистема сбора, хранения, обработки и т.д.)

  2. Организационные подсистемы.

Логико-семантический комплекс (ЛСК) - совокупность языковых, логических и математических средств, предназначенных для формализованного описания семантической информации с целью её последующей обработки и поиска.

Компоненты ЛСК:

  1. Языковые средства ИС.

У естественного языка есть 2 особенности : избыточность и недостаточность.

Избыточность. Для передачи содержания сообщения активную роль играют только некоторые слова (ключевые), всё остальное можно выкинуть для понимания смысла текста. Также в языке существует много синонимов и близких по значению слов. Также естественный язык допускает перефразировку.

Недостаточность выражается в многозначности отдельных слов естественного языка (омонимия, полисемия – название одного предмета переносится на другой, имеющий схожие признаки), элипсности (пропуск в тексте слов, которые явно подразумеваются).

ИПЯ – информационно-поисковый язык – специальный искусственно-созданный язык, предназначенный для описания основного содержания и формальных характеристик документов с целью реализации последующего автоматизированного поиска.

Информационный язык – система, предназначенная для описания, обработки, поиска информации, содержащей алфавит, правила образования языковых конструкций, а также правила их образования, интерпретации. Пример: алгоритмический язык.

Эта способность выражается по-разному, в зависимости от того, на каком уровне представления языковых объектов мы рассматриваем