Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
PI_LEKTsII.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
303.1 Кб
Скачать

Тема 9. Основы теории информационного поиска.

С проблемой поиска информации человечество сталкивалось постоянно. Библиотеки, архивы, телефонные справочники – все это информационные системы различного уровня и различной степени значимости.

Существует стратегия поиска. В некоторых ситуациях стратегия поиска указывается специальным образом. Так, информационный массив должен быть определенным образом упорядочен, что облегчает поиск. Сначала надо найти ту отрасль права, где может содержаться нормативный акт, а затем – сам акт или правовую норму.

Теория информационного поиска различает ассоциативный поиск и ассоциативное рассуждение. Решение неизвестной задачи так или иначе основывается на уже решенных. Способ решения должен быть близок к тому, который когда-то помог справиться с подобной задачей. Для этого надо обратиться к памяти и попробовать найти нечто похожее, ранее уже встречавшееся. Это и есть ассоциативный поиск.

Проблема информационного поиска существует во всех видах юридической деятельности. Особо острый характер она имеет в сфере нормативной правовой информации, особенность которой состоит в том, что она является официальной и документированной.

Методы компьютерного поиска правовой информации необходимо совершенствовать. Одна из возможностей данного направления – создание гипертекстовых баз данных. Гипертекст – это особая форма организации, представления текстового материала. Гипертекстовые технологии содержат правила перехода от одного текста к другому с использованием ЭВМ. Например, система ссылок на иные нормативные акты, содержащиеся в данном акте.

Информационно-поисковый язык. Правовой тезаурус.

Одной из важных задач правовой информатики является лингвистическое обеспечение правотворческого процесса. Право не существует вне языка.

Ст.2 Закона об информации относит к средствам обеспечения автоматизированных информационных систем также и лингвистические средства.

В системе лингвистических средств обеспечения АИПС первое место занимает информационно-поисковый язык (ИПЯ).

В широком смысле язык – это знаковая система, используемая для сбора, хранения, обработки и передачи информации.

ИПЯ – это формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью их последующего хранения и поиска.

ИПЯ по законодательству должен обеспечивать:

  • Эффективную формализацию правовых норм и нормативных актов

  • Высокую скорость поиска на компьютере информации

  • Оптимальный перевод нормативного текста с юридического языка на язык, доступный ЭВМ

  • Минимальный «шум», т.е. сведение к минимуму выдачу компьютером излишней информации

  • Полноту информационного поиска, т.е. получение всей необходимой информации для решения конкретных задач правотворчества

Любая информация для того, чтобы быть переделанной, должна соответствующим образом кодироваться, т.е. переводиться на язык специальных символов или сигналов.

Теория информационного поиска различает следующие типы ИПЯ:

  1. Языки предметного типа – это алфавитно-предметные указатели к сборникам и отдельным нормативным актам и широко распространенные алфавитно-предметные рубрикаторы.

При использовании этого языка основная тема документа выражается одним или несколькими типовыми словами – рубриками. Например, существуют предметно-алфавитные указатели к Конституции РФ, к ГК РФ.

  1. Язык классификационного типа – представляет собой классификатор отраслей законодательства.

  2. Язык дескрипторного типа – обладает большой «семантической силой», т.е. способен полностью передавать смысл нормативных актов, выразить комбинацией дескрипторов (ключевое слово – объединяющее группу ключевых слов) любое понятие, характеризуются высокой степенью отражения смысла документов, наличием ключевых слов.

Дескрипторные ИПЯ делятся на:

  • языки, в которых не различаются логико-смысловые отношения между понятиями

  • языки, которые содержат в своем составе логико-смысловые отношения.

  • (особо) правовой тезаурус – это логико-семантическое собрание ключевых слов и дескрипторов, применяемых в качестве лингвистического обеспечения и использования АИПС правовой информации.

Задача – упорядочить и привести в систему лексические средства, используемые в правотворческом процессе.

В информатике тезаурус выполняет следующие функции:

  • используется для организации информационного поиска (информационно-поисковый тезаурус)

  • используется как лингвистическое средство в процессе решения правотворческих задач (полный словарь терминов, определения юридических понятий, комментарии, данные о количестве дескрипторов)

  • используется как средство, измеряющее смысл сообщения (тезаурус пользователя – совокупность сведений, которыми располагает пользователь)

  • выступает в качестве важнейшего средства поиска латентной информации

Существуют тезаурусы различных типов:

  • общеправовой (102 тысячи слов и словосочетаний). Сейчас не применяется.

  • Тезаурус, специализированный по отраслям права. (например, Eurovoc).

Подготовка правовой информации к машинной обработке:

метризация; кодирование; индексирование и рубрицирование.

В широком смысле под метризацией понимается описание определенной совокупностью числовых характеристик. В зависимости от того, что используется в качестве характеристик выделяют два типа метризации: а) подсчет; б) измерение.

При измерении и подсчете в качестве средства выражения используются натуральные числа. При измерении используются единицы меры.

Объектами измерения могут выступать любые предметы материального мира, обладающие любыми свойствами, которые могут быть измерены или характеризуются количественными данными.

Под метризацией правовой информации следует понимать такую процедуру ее обработки в результате которой субъект юридической деятельности получает количественные характеристики тех или иных параметров объекта познания.

Характеристики, полученные в результате измерения, могут выражаться как в абсолютных величинах, так и в относительных.

Кодирование правовой информации – это такая операция, при которой определенные данные заменяются сокращенными условными обозначениями (цифры, числа). Обратная операция называется декодированием.

Комбинацию символов называют кодом, а количество символов, входящих в кодовую операцию называют длина кода.

Для кодирования правовой информации используется несколько способов: точечный, контурный, точечно-зональный.

Одним из видов формализации правовой информации является индексирование – это процесс отбора из текста терминов (ключевых слов), которые, по мнению специалиста – юриста, отражают основное содержание темы. Далее такие термины преобразовывают в форму информационно-поискового языка.

Рубрицирование – это процедура присвоения определенной теме нормативного акта или запроса соответствующего индекса из рубрикатора, в котором за каждой темой закреплен свой индекс.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]