
Вопрос7.
Документальные системы служат для работы с документами, в которых информация хранится в виде текстовых документов (статьи, книги, рефераты, тексты законов) и графических объектов, снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям
Информационно-поисковый язык (ИПЯ) является семантической системой, обеспечивающей передачу (запись) содержания документа в объеме, необходимом для целей поиска. Задачей ИПЯ является перевод содержания документа в поисковое предписание или поисковый образ документа ( при вводе документа в ИПС) и перевод содержания запросов пользователя в поисковый образ запроса (поисковое предписание).
Система индексирования (СИ) совокупность методов и средств перевода текстов с естественного языка на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ПНЯ.
Технология обработки данных. Структура и функционирование конкретной ИПС зависят от вида и состава информационных источников, от способов реализации информационного поиска.
Под ИПС понимается некоторый комплекс связанных друг с другом отдельных частей, предназначенных для выявления в некотором множестве элементов информации, которая отвечает на информационный запрос, предъявляемый к системе.
Процедура информационного поиска документальной информации делят на 2 контура.
1. Семантическое осмысление запроса и выдача адресов (шифров, кодов), соответствующих запросу документов. 2. Отыскание самих документов (вручную или с помощью специальных технических средств, если ими оборудовано хранилище).
Представление ИПС в виде двух контуров является в настоящее время наиболее распространенным.
Под логикой ИПС понимают критерий выдачи или критерий смыслового соответствия (обязательный элемент), базисные (парадигматические) отношения и текстуальные (синтагматические) отношения между словами ИПЯ (могут отсутствовать).
Оценки документальных систем. Различают два класса оценок:
Внешние или функциональные оценки - основаны на сравнении результатов работы системы с результатами идеального содержательного поиска, осуществляемого экспертом. Они предполагают понятие релевантности.
Внутренние или нефункциональные оценки - могут основываться на таких структурных качествах системы как сложность, степень близости к человеческой логике или естественному языку, степень алгоритмичности и т.п.
Оценка или метод оценки — это алгоритмическая процедура, которая любому оцениваемому объекту из данной области ставит в соответствие некоторый другой объект, называемый значением оценки. Полностью алгоритмическую процедуру оценки называют формальной оценкой. Различают два типа внешних оценок: оценки-описания, значения которых характеризуют непосредственно систему безотносительно к другим системам; оценки-шкалы, значения которых определяют сравнительные достоинства различных ИПС.
Содержательные представления о сравнительных достоинствах называется содержательной оценкой.
информационным поиском понимается некоторая последовательность операций, выполняемых с целью отыскании документов (статей, научно-технических отчетов и т.д.), содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы.
Массив элементов информации, в котором производится информационный поиск, условно назван поисковым массивом.
Критерии поиска или критерии смыслового соответствия (КСС).
- Точность поиска определяется точностью отображения документов и запросов с помощью ПОД и ПОЗ. Для оценки качества поиска вводят специальные критерии.
- Релевантность — соответствие выдачи запросу, т.е. характеризуется качество алгоритма поиска.
- Пертинентность - соответствие выдачи потребностям пользователя, т.е. характеризуется смысловыражающая возможность ИПЯ, точность отображения с его помощью информационных потребностей.
Программные средства реализации документальных ИС.
К этому классу относятся системы для работы, хранения и регулярного обновления в компьютере сборников нормативных документов и др. Под собирательным названием "правовые" понимаются различные специальные информационно-справочные или подобные системы правовых, нормативных документов, основных бухгалтерских понятий, баз данных и т.п. Лидерами в этом классе являются отечественные информационно-правовые и справочные системы "Консультант Плюс", "Гарант-Сервис", "Кодекс". Компания "Общероссийская сеть КонсультантПлюс". Системы "КонсулыпантПлюс" используются как опытными, так и начинающими пользователями, так как они предоставляют богатейшие возможности для поиска документов и анализа законодательства. Интуитивно понятные принципы общения с системой позволяют даже неподготовленному пользователю освоить базовые операции работы с системой после 20 мин. предварительного обучения. Компания "Гарант" — одна из крупнейших российских информационных компаний. Направление деятельности — производство и поддержка компьютерной правовой системы "Гарант", информационно-правовое обслуживание предприятий, общественных объединений и организаций. Названная система создана специально для тех, кто работает с нормативными документами и решает правовые вопросы. Это колоссальный информационный банк, охватывающий весь спектр российского законодательства и основных норм международного права. Все документы поступают в систему непосредственно из 186 органов власти и управления.