Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 4. Классификация ИС_ч1. ДИС, ФИС, ГИС.docx
Скачиваний:
4
Добавлен:
10.11.2019
Размер:
1.22 Mб
Скачать
  1. Индексирование документов, индексирование запросов и процедуры поиска нужной информации осуществляются с применением информационно-поискового языка (ипя).

Система индексирования – совокупность методов и средств перевода текстов с естественного языка на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ИПЯ.

Информационно-поисковый язык (ИПЯ) – специализированный искусственный язык, предназначенный для описания основного содержания (центральной темы) и формальных характеристик документов с целью информационного поиска.

Основными элементами ИПЯ являются:

  • алфавит - система знаков, используемых для записи слов и выражений ИПЯ;

  • лексика - совокупность слов, словосочетаний и выражений, используемых для построения текстов ИПЯ;

  • грамматика - совокупность средств и способов построения, изменения и сочетания лексических единиц, включает морфологию и синтаксис1.

Требования к ИПЯ:

  • ИПЯ должен располагать лексико-грамматическими средствами для точного выражения основного содержания текста;

  • ИПЯ не должен быть двусмысленным;

  • ИПЯ должен быть удобным для алгоритмизации;

  • ИПЯ не должен содержать элементы, отображающие волевое побуждение, эмоции.

  1. Общая блок-схема документальной информационно-поисковой системы может быть изображена в виде [Рисунок 1]

Блок записи документов и блок поиска документов, помимо непосредственного обращения к базе документов (для записи, сопоставления или считывания) отвечают за представление ПОД и ПОЗ в машинных кодах – имеет место кодирование.

Поскольку документальные ИПС весьма индивидуальны, слабо поддаются классификации и структуризации, более точно представить схему функционирования таких систем в общем виде не представляется возможным.

Блок индексирования документов

Рисунок 1. Блок-схема функционирования документальной ИПС

Фактографические ИПС

В отличие от первого вида систем в ИПС такого типа хранятся не документы, а факты, относящиеся к какой либо предметной области. Хранимые факты могут быть извлечены из различных документов и связанны между собой системой разнообразных отношений.

Фактографические ИПС – взаимосвязанная совокупность языковых, логических, программных, информационных, технических, организационных средств ввода, переработки, хранения, поиска и выдачи жестко структурированной информации.

ИПС фактографического типа приближаются по своей организации и функционированию к базам и банкам данных и знаний.

Банк данных - автоматизированная информационная система централизованного хранения и коллективного использования данных. В состав банка данных входят одна или несколько баз данных, справочник баз данных, систем управления базами данных, а также библиотеки запросов и прикладных программ.

Данные, структурированные таким образом, чтобы их могли использовать разные программы – базы данных. Средства создания и управления этими базами получили названия систем управления базами данных.

Независимость хранимых данных от использующих их программ обеспечивается трехуровневой архитектурой представления данных [Рисунок 2].