Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие_2010.docx
Скачиваний:
239
Добавлен:
03.06.2015
Размер:
4.23 Mб
Скачать

Информационно-поисковый язык

Теория информационного поиска различает следующие типы ИПЯ

Языки предметного типа — это алфавитно-предметные указатели к сборникам и отдельным нормативным актам и широко распространенные алфавитно-предметные рубрикаторы. При использовании языка этого типа основная тема (предмет) документа выражается одним или несколькими типовыми словами — рубриками. Все документы в Системе «КонсультантПлюс» классифицируются по тематическому рубрикатору, который является собственной разработкой специалистов «Консультант Плюс» на основе Общеправового классификатора отраслей законодательства

Язык классификационного типа представляет собой не что иное, как Классификатор отраслей законодательства, принятый Указом Президента РФ в 1993 г.

Языки дескрипторного типа – наиболее полно отражают смысл текста. Эти языки строятся на основе правового тезауруса.

Правовой тезаурус — это собрание ключевых слов и дескрипторов, применяемых в качестве лингвистического обеспечения и использования автоматизированных информационно-поисковых системах правовой информации.

Тезаурус учитывает семантические связи между словами: антонимы (противоположный смысл), синонимы (тот же смысл), гипонимы (более узкое понятие), гиперонимы (более широкое понятие). Например, правовая информация является гиперонимом нормативно-правовой информации, а закон – гипонимом нормативного документа.

Ключевые слова наиболее полным образом описывают содержание правовых норм (актов), их самые существенные черты.

Дескриптор — это выделенное ключевое слово, которое представляет целую группу ключевых слов, являющихся синонимами или уточнениями.

Поисковый образ правовой нормы (нормативного правового акта) — это формализованное представление структурных элементов НПА (нормы, статьи, акты в целом) в терминах информационно-поискового языка (ключевых слов и дескрипторов). Поисковый образ правового акта (его части) служит для хранения данного документа в памяти компьютера.

Как уже отмечалось, качество поиска сильно зависит от того, насколько правильно пользователь формирует запрос.

В идеале язык запроса должен совпадать с естественным языком. Естественный язык запроса – формулирование запроса к поисковой системе так же, как он был бы сформулирован при обращении к живому эксперту;

система должна помогать пользователю правильно формулировать свои информационные потребности.

Для этих целей создаются экспертные информационные системы.

Экспертные системы — это компьютерные программы, формализующие процесс принятия решений человеком. Назначение таких систем — формирование и вывод рекомендаций в зависимости от текущей ситуации. Совокупность сведений или данных, которые описывают ситуацию, вводятся пользователем в диалоговом режиме.

Экспертные информационные системы требуют гораздо больших затрат для разработки и сопровождения, поэтому они не имеют широкого применения.

Разработчики справочных поисковых систем также пытаются упростить язык запросов. Одним из путей упрощения языка запроса – использование морфологического поиска. В этом случае на основе словаря или морфологического анализа определяется основа слова и возможные окончания. Поиск осуществляется по сочетанию основы и всех возможных окончаний.

Следующим шагом является создание «Помощников», которые в диалоговом режиме уточняют запрос, если в качестве ключевых слов задаются слишком общие понятия или, наоборот, слишком конкретные. Для уточнения используются другие ключевые слова, относящиеся к тому же дескриптору, но являющиеся гипонимами или гиперонимами слова из запроса.

Дополнительные возможности справочных правовых систем

Конкуренция на рынке информационных услуг заставляет разработчиков СПС непрерывно совершенствовать свои системы, расширять сервисные модули. Рассмотрим некоторые из них

Создание гипертекстовых ссылок. Большинство текстов любой природы, включая и правовые, содержат наряду с основным и некоторые иные тексты — второго порядка: система ссылок к тексту, комментарии к нему, разные редакции текста, тексты, отвечающие или возражающие друг другу, и др. Гипертекстовые технологии позволяют переходить на эти ссылки и возвращаться обратно, не выходя из окна документа.

Создание собственных комментариев к законодательству. Наиболее крупные производители создают комментарии к законодательству силами своих экспертов.

Аннотирование новых документов. В период обработки документа для его индексации, когда текст документа еще недоступен при поиске. Например, в «Консультант Плюс» для этого служит раздел «Новости законодательства», который содержит аннотации к принятым в течение недели новые НПА.

Обработка связей документов. Связи документов позволяют найти комментарии, разъяснения НПА. А также указать на зависимость одних НПА от других. Связи документа позволяют рассмотреть правовую проблему в целом, используя сведения о всех понятиях и документах, встречающихся в тексте.

Создание сервиса для работы с документами. При анализе правовой проблемы списки используемых документов, закладки и комментарии к текстам. Цитаты из документов удобно иметь возможность вставить в текст отчета во внешнем текстовом редакторе.

Упрощение поиска для непрофессиональных пользователей путем создания упрощенного рубрикатора. Такой рубрикатор строится на основе типичных ситуаций, с которыми сталкивается непрофессиональный пользователь.

Создание интегрированных поисковых систем. Такие системы позволяют осуществлять правовую поддержку пользователя внутри другой программы. При этом осуществляется автоматический поиск документов, в соответствии с тем, какая задача решается в основной программе. Например, при формировании НДС в бухгалтерской программе «1С» будет выведен список НПА, в которых упоминается НДС.