Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 семестр 1 курс / Pravovaya_informatika_i_osnovy_informatsionnogo_p / 08.04.11 Правовая информатика

.doc
Скачиваний:
35
Добавлен:
21.05.2015
Размер:
47.62 Кб
Скачать

Автоматизация обработки правовой информации.

Основной вопрос – методы и способы обработки правовой информации в машинной обработке.

Весь массив правовой информации необходимо представить в машиночитаемом виде.

Машинное слово – это байт (8 бит).

Методы подготовки информации к машинной обработке:

Формализация, метризация и кодирование.

Формализация – это выявление и уточнение содержания правового явления через рассмотрение и фиксацию его формы и оперирование с нею.

Устойчивыми конструкциями, которыми мы можем записывать информацию – это буквы, знаки, символы и тому подобное.

Второй метод – это метризация. Это описание объекта совокупностью числовых характеристик.

Два способа метризации – подсчёт и измерение.

При подсчёте используют натуральные числа, а при измерении – принятые единицей меры (градусы, радианы, граммы, килограммы…).

Третий способ – это кодирование.

Кодирование – это замена каких-либо данных сокращёнными условными обозначениями.

Способы кодирования: ручное, механизированное и автоматизированное.

Ручной способ очень широко сейчас используется – это в виде карточек и других форм типовых документов. Сейчас осуществляется на основании совместного приказа Генеральной Прокуратуры, МВД, МЧС, Министерства юстиции, ФСБ, Минэкономразвития и ФСКН (госнаркоконтроль) от 29 декабря 2005 года. В качестве приложения в этом приказе очень много форм. Форма №1 – статистическая карточка на выявленное преступление…

Механизированное используется не так часто. Используются координатные сетки и точечное и контурное кодирование.

Автоматизированные способы – это при помощи сканера. В последнее время стали использовать голографические способы снятия объёмной информации.

Мы подготавливаем правовую информацию для того, чтобы обработать, а обработка нам нужна для того, чтобы избавиться от рутинной работы.

Информационно-поисковая система – это совокупность средств для хранения, поиска и выдачи информации по запросу.

Поиск (в самом общем виде) – это процесс извлечения элемента из массива.

Массивы бывают неорганизованные и организованные (организованные ещё делятся на разные классификации, связанные с матрицей и т.д.).

В неорганизованном поиске поиск является случайным. А в организованном массиве поиск детерминированный, то есть предопределённый.

Примером организованного массива является наша библиотека – у нас есть каталоги и алфавитные, и тематические, и по авторам…

По способу поиска информационно-поисковые системы бывают ручные, механизированные и автоматизированные.

Ручные – это человек с его руками (когда мы заходим в библиотеку, берём каталог и начинаем карточки перебирать).

Механизированный – раньше был, когда есть часть и от руки написанное, а есть и элементы механики.

Автоматизированная информационно-поисковая система – это система, реализующая хранение поиска и выдачу информации на базе использования ЭВМ как совокупности языково-алгоритмических и технических средств.

Виды поиска:

1. Путём образа документа. А ещё точнее – создание поискового образа документа. Он представляет собой текст, который на информационно-поисковом языке отражает содержание документа.

Четыре уровня поискового образа документа:

  1. Библиографическое описание (первый и самый низший уровень). В него входит: наименование документа; орган, который его принял (или автор, который его издал); место принятия или издания; дата принятия или издания; объём документа.

  2. Аннотация. Второй уровень. Аннотация – это краткое описание документа (больше, чем библиографическое описание), объёмом не более пятисот знаков (примерно полстраницы машинописного текста).

  3. Реферат (это третий уровень). Это не только описание документа, но и выводы о нём и место в системе других документов. Примерно полторы тысячи знаков, не более.

  4. Четвёртый и самый полный уровень – это текст самого документа.

2. Второй способ поиска. При помощи классификаторов. В нашей стране утверждены порядка двух десятков классификаторов, в правоведении используются три.

Для законодательства и нормативных актов используют классификатор правовых актов, одобренный Указом Президента от 15 марта 2000 года. В него включается двадцать одна отрасль российского законодательства (именно отрасли законодательства, а не права). У него трёхуровневая структура. 010.000.000 – конституционный строй. 030.000.000 – гражданское право… 120.000.000 – информация и информатизация (информационное законодательство).

Каждая отрасль законодательства имеет свою структуру, состоит из нескольких разделов, которые разделяются на институты, субинституты, конечная единица – нормы.

Семь разделов отрасли информации и информатизации:

120.010.000 – общие положения. 120.020.000 – управление в сфере информации и информатизации.

120.030.000 – информационные ресурсы (пользование информационными ресурсами), разделяется на восемь институтов: 120.030.010 – общие положения; 120.030.020 – документирование информации и делопроизводство; 120.030.030 – обязательный экземпляр документов; 120.030.040 – архивный фонд и архивы; 120.030.050 – информационные ресурсы по категориям доступа; 120.030.060 – информация о гражданах (персональные данные); 120.030.070 – правовая информация; 120.030.080 – предоставление информации и информационные услуги.

120.040.000 – информация и информационные системы. Разделяется на два института. 120.040.010 – информатизация и 120.040.020 – информационная система, технологии и средства из обеспечения.

120.050.000 – средства массовой информации (СМИ).

120.060.000 – реклама.

120.070.000 – это информационная безопасность, защита информации и прав субъектов в области информационных процессов и информатизации.

Ряд институтов является межотраслевыми. Это относится к управлению в сфере информации и информатизации, сфера СМИ (образование и культура) и информационная безопасность (безопасность и охрана правопорядка).

Для научной литературы используются два классификатора: УДК (универсальный десятичный классификатор) и ББК (библиотечно-библиографический классификатор).

УДК – во всём мире, а ББК – у нас.

В УДК код наш: 34 – право и юридические науки. Число кодов больше всего – 4414. Все право и юридические науки состоят из 18 отраслей науки: 348 – церковное право, 349 – специальные отрасли права…

ББК право и юридические науки – состоит из 13 отраслей права. Но у лектора он уже устарел.

1672 закона (месяца два назад так было), которые действуют в нашей стране сейчас. А всего – почти семь тысяч (но это с учётом тех законов, которые вносят изменения в другие законы).

3. По объектам поиска.

Два вида – фактографические и документальные информационно-поисковые системы.

В фактографических информационно-поисковых системах происходит хранение, поиск и выдача различных сведений (или фактов): о личности (в том числе может быть и изображение личности в графических файлах), о преступлении, о следах, о доказательствах и тому подобное.

Все фактографические АИПС подразделяются на три группы: информационно-справочные, информационно-логические и экспертные системы. Разница между ними заключается в характере решаемых задач.

Информационно-справочная система – простейшая из этих систем. Если есть запрашиваемый элемент – вытаскивает и выдаёт, нет элемента – не выдаёт.

Информационно-логическая система – в ней происходит алгоритмическое решение задач по синтезу новых сведений и выдаёт те сведения, которые в явной форме там нет.

Экспертная система вообще может делать выводы, не связанные с информационной базой. Она получает новые знания – она может судить (то есть совершать логические суждения, делать логические выводы, может самообучаться, разговаривать с пользователем…).

Документальные информационно-поисковые системы – они предназначены для описания документа и выдачи поиска с необходимой информацией.

Фактографические АИПС больше используются для экспертиз, опознаний, расследований преступлений, то документальные АИПС прежде всего – для законодательства (Консультант, Гарант, Референт).

Два вида документальных информационно-поисковых систем:

1) Избирательное распределение информации (избирательный вид). Это значит, что каждый сеанс поиска производится по одному и тому же запросу, который отражает постоянные интересы пользователя.

2) Справочные, которые выполняют функции справочного или рестропективного поиска. Здесь каждый сеанс поиска осуществляется по разовым запросам (так чаще всего и происходит).

Есть искусственный язык общения – информационно-поисковый язык, он предназначен для записи и поиска семантической или смысловой информации. Его цель – описание тем, предметов или формальных характеристик поисковых образов документов, а также выражение содержания информационных запросов.

Базируется на естественном языке (в нашем случае – на русском языке) и как и любой язык, состоит из слов, которые бывают двух видов: ключевое слово и дескриптор.

Ключевое слово – это слово, которое отражает содержание документа (от восьми до пятнадцати ключевых слов достаточно, чтобы полностью описать документ). Раньше ключевые слова выделяли интуитивно, а теперь – есть закон «чем реже встречается символ, тем большую информацию он в себе несёт, а чем чаще встречается – тем меньшую информацию в себе несёт». Учёные составили частотный словарь русского языка, где все буквы и слова по степени убывания частотности (наиболее часто встречаемая буква – «о»).

Ключевое слово – это лексическая единица, которая описывает языковую конструкцию, выбираемую из текста.

Дескриптор – это словарная единица, выраженная словом или словосочетанием и связанная с другими словами логическими (семантическими) связями.

Все эти слова (ключевые и десприторы0 включаются в словарь, который называется тезаурус.

Семь видов связей между словами: синонимы, функциональная связь (предприятие – производство), родовидовая связь (машина – автомобиль, компьютер, теплоход…), часть и целое (факультет и университет или институт), ассоциативная связь (подданство – гражданство; найм – раньше только жилищный; устойчивые типичные словосочетания, к примеру «явка с повинной»).