
- •4.1. Основные понятия и определения. 29
- •Введение
- •1. Основные понятия и классификация информационных систем
- •1.1. Принципы функционирования и основные элементы ис
- •1.2. Классификация ис.
- •1.3. Технологии описания предметной области
- •1.4. Архитектура клиент - сервер
- •2. Документальные информационные системы
- •2.1. Основные понятия и классификация документальных ис.
- •2.2. Информационно-поисковый язык
- •2.3. Эффективность функционирования документальных ипс.
- •3. Гипертекст.
- •3.1. Основные понятия и определения.
- •3.2. Технологии разметки документов.
- •3.3. Технологии документирования информационных ресурсов - oda.
- •4. Фактографические информационные системы
- •4.1. Основные понятия и определения.
- •4.2. Структурированные типы данных.
- •4.3. Основные модели данных.
- •4.4. Семантические модели данных.
- •4.5. Иерархическая модель данных
- •4.6. Сетевая модель данных
- •4.7. Реляционная модель данных
- •5. Предметно-ориентированные ис.
- •5.1. Информационные хранилища.
- •5.2. Геоинформационные системы.
- •5.3. Банковские информационные системы
- •6. Безопасность информационных систем
- •7. Основные термины и их определение в области информацинных технологий
- •7.1.Общие термины
- •7.2.Основные виды технологических процессов, составляющих информационную технологию
- •7.3.Основные средства информационной технологии.
- •7.4.Базовые и прикладные информационные технологии.
- •Литература
2. Документальные информационные системы
2.1. Основные понятия и классификация документальных ис.
В развитии программного обеспечения СУБД в 70-е – 80-е годы превалировало направление, связанное с фактографическими информационными системами, т.е. с системами, ориентированными на работу со структурированными данными. Были разработаны основы и модели организации фактографических данных, отработаны программно-технические решения по накоплению и физическому хранению таких данных, реализованы специальные языки запросов к базам данных и решен целый ряд других задач по эффективному управлению большими объемами структурированной информации. В результате основу информационного обеспечения деятельности предприятий и организаций к началу 90-х годов составили фактографические информационные системы, вобравшие в себя в совокупности колоссальный объем структурированных данных.
Потребности в системах, ориентированных на накопление и эффективную обработку неструктурированной или слабоструктурированной информации привели к возникновению еще в 70-х годах отдельной ветви программного обеспечения систем управления базами данных, на основе которых создаются документальные информационно-поисковые системы.
Основной задачей документальных информационных систем является накопление и предоставление пользователю документов, содержание, тематика, реквизиты и т.п. которых адекватны его информационным потребностям. Поэтому можно дать следующее определение документальной ИС - единое хранилище документов с инструментарием поиска и отбора необходимых документов.
Поисковый характер документальных информационных систем исторически определил еще одно их название — информационно-поисковые системы (ИПС), хотя этот термин не совсем полно отражает специфику документальных ИС.
Соответствие найденных документов информационным потребностям пользователя называется пертинентностъю.
В силу теоретических и практических сложностей с формализацией смыслового содержания документов пертинентность относится скорее к качественным понятиям, хотя, как будет рассмотрено ниже, может выражаться определенными количественными показателями.
В зависимости от особенностей реализации хранилища документов и механизмов поиска документальные ИПС можно разделить на две группы:
системы на основе индексирования;
семантически-навигационные системы.
Семантика (от греч. «semantikos» - обозначающий) — смысловая сторона языка, отдельных слов и частей слова, а также раздел языкознания, изучающий значения слов.
В семантически-навигационных системах документы, помещаемые в хранилище (в базу) документов, оснащаются специальными навигационными конструкциями, соответствующими смысловым связям между различными документами или отдельными фрагментами одного документа. Способ и механизм выражения информационных потребностей в подобных системах заключаются в явной навигации пользователя по смысловым отсылкам между документами. В настоящее время такой подход реализуется в гипертекстовых ИПС.
В системах на основе индексирования исходные документы помещаются в базу без какого-либо дополнительного преобразования, но при этом смысловое содержание каждого документа отображается в некоторое поисковое пространство. Процесс отображения документа в поисковое пространство называется индексированием и заключается в присвоении каждому документу некоторого индекса-координаты в поисковом пространстве. Формализованное представление индекса документа называется поисковым образом документа (ПОД). Пользователь выражает свои информационные потребности средствами и языком поискового пространства, формируя поисковый образ запроса (ПОЗ) к базе документов.
Система на основе определенных критериев и способов ищет документы, поисковые образы которых соответствуют или близки поисковым образам запроса пользователя, и выдает соответствующие документы. Соответствие найденных документов запросу пользователя называется релевантностью. Схематично общий принцип устройства и функционирования документальных ИПС на основе индексирования иллюстрируется на Рис.2.1.
Рис.2.2. Общий принцип функционирования документальных ИПС на основе индексирования