- •Тема 4. Классификация ис по характеру представления и логической организации хранимой информации. Документальные и фактографические ис. Спс. Гис.
- •Индексирование документов, индексирование запросов и процедуры поиска нужной информации осуществляются с применением информационно-поискового языка (ипя).
- •Предметная область
- •Справочно-правовые системы, как вид документальных ипс
- •Иная официальная правовая информация
- •Нормативная правовая информация
- •Договоры
- •Геоинформационные системы.
Индексирование документов, индексирование запросов и процедуры поиска нужной информации осуществляются с применением информационно-поискового языка (ипя).
Система индексирования – совокупность методов и средств перевода текстов с естественного языка на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ИПЯ.
Информационно-поисковый язык (ИПЯ) – специализированный искусственный язык, предназначенный для описания основного содержания (центральной темы) и формальных характеристик документов с целью информационного поиска.
Основными элементами ИПЯ являются:
алфавит - система знаков, используемых для записи слов и выражений ИПЯ;
лексика - совокупность слов, словосочетаний и выражений, используемых для построения текстов ИПЯ;
грамматика - совокупность средств и способов построения, изменения и сочетания лексических единиц, включает морфологию и синтаксис1.
Требования к ИПЯ:
ИПЯ должен располагать лексико-грамматическими средствами для точного выражения основного содержания текста;
ИПЯ не должен быть двусмысленным;
ИПЯ должен быть удобным для алгоритмизации;
ИПЯ не должен содержать элементы, отображающие волевое побуждение, эмоции.
Общая блок-схема документальной информационно-поисковой системы может быть изображена в виде [Рисунок 1]
Блок записи документов и блок поиска документов, помимо непосредственного обращения к базе документов (для записи, сопоставления или считывания) отвечают за представление ПОД и ПОЗ в машинных кодах – имеет место кодирование.
Поскольку документальные ИПС весьма индивидуальны, слабо поддаются классификации и структуризации, более точно представить схему функционирования таких систем в общем виде не представляется возможным.
Блок индексирования документов
Рисунок 1. Блок-схема функционирования документальной ИПС
Фактографические ИПС
В отличие от первого вида систем в ИПС такого типа хранятся не документы, а факты, относящиеся к какой либо предметной области. Хранимые факты могут быть извлечены из различных документов и связанны между собой системой разнообразных отношений.
Фактографические ИПС – взаимосвязанная совокупность языковых, логических, программных, информационных, технических, организационных средств ввода, переработки, хранения, поиска и выдачи жестко структурированной информации.
ИПС фактографического типа приближаются по своей организации и функционированию к базам и банкам данных и знаний.
Банк данных - автоматизированная информационная система централизованного хранения и коллективного использования данных. В состав банка данных входят одна или несколько баз данных, справочник баз данных, систем управления базами данных, а также библиотеки запросов и прикладных программ.
Данные, структурированные таким образом, чтобы их могли использовать разные программы – базы данных. Средства создания и управления этими базами получили названия систем управления базами данных.
Независимость хранимых данных от использующих их программ обеспечивается трехуровневой архитектурой представления данных [Рисунок 2].