- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
1. Информация. Основные свойства и определения
Информатизация общества является стратегическим фактором развития цивилизации, который, благодаря особым свойствам информации, дает человечеству определенные шансы решить глобальные проблемы и перейти к новой парадигме устойчивого развития. При этом информационные системы и технологии становятся теми средствами, которые человек может использовать как для расширения, так и для развития своих собственных способностей: памяти, логики, пространственного воображения.
1.1.Информация как основной предмет информатики
Вкачестве источников информатики как теоретической платформы информационных систем обычно называют две науки — документалистику и кибернетику, возниковение которых было тесно связано с бурным развитием производственных систем и технологий. Основным предметом документалистики стало изучение рациональных средств и методов повышения эффективности документооборота как информационной основы накопления и поиска информации. Понятие информации составило также и основу кибернетики, как науки о методах анализа и синтеза систем эффективного управления.
Развитие средств вычислительной техники и широкое ее использование в различных областях человеческой деятельности привело к тому, что с понятием «информатика» стала тесно связана и другая область — наука о средствах вычислительной техники (Computer Science). И сегодня предмет информатики, рассматриваемой уже как совокупность информационных ресурсов и технологий, в общем случае составляют такие понятия, как:
−средства вычислительной техники;
−программное обеспечение средств вычислительной техники;
−методы взаимодействия человека с вычислительной техникой и программными средствами (программным обеспечением);
−информационные ресурсы5 (ИР), в том числе средства создания, хранения, поиска информации;
−средства итехнологии доступа к распределенным информационным ресурсам;
−методы и средства взаимодействия человека с информационными ресурсами на базе вычислительной техники с использованием программного обеспечения;
−инструментальные технологии, обеспечивающие жизненный цикл ИР.
5 В [Громов, Попов96] к информационным ресурсам относят не только информационные продукты, но и средства и технологии их создания и использования
Информатика занимается не собственно вычислениями, а обработкой информации (представленной, преимущественно, в числовой и символьной форме), а само содержание термина «вычисления» в информатике расширяется, охватывая наряду с собственно вычислительными процессами также и те, которые связаны с кодированием и обработкой текстов, их поиском и передачей по различным каналам связи. Это обеспечивает возможность для уменьшения разнообразия и сложности знаковых средств, используемых для представления информации при сохранении ее количества. Современные формы представления информации (искусственные языки, модели, коды, символы, формулы и т.п.) позволяют минимумом знаковых средств выразить максимум содержания информации. Одна и та же по содержанию и объему информация может быть представлена более емко или менее емко в зависимости от того, какими знаками она выражена [Аветисян99].
Однако концентрация информации - это не только выбор системы знаков для ее более компактного выражения. Непрерывный процесс концентрации информации - это процесс постоянного ее обобщения, сведение разрозненных фактов и данных в более емкие и вместе с тем более богатые, глубокие, зачастую фундаментальные и методологические знания, из которых могут выводиться конкретные следствия или предположения. Это позволяет отказаться от запоминания и фиксирования исходных или выводимых составных элементов концентрированной информации, т.к. они всегда могут быть получены из более общего знания, более общей информации.
Приведем определение основного предмета информатики (определяющего основные объекты информационных коммуникаций), данное в предисловии к первому изданию одного из первых фундаментальных трудов в области автоматизированных информационных систем – «Основы научной информации» [Михайлов68]: «…научная информация захватывает три совершенно различные области человеческой деятельности. Первая – это мало исследованная область творческого мышления человека и организация умственного труда. Проблема поиска необходимых специалисту сведений может быть успешно решена лишь при условии, что будут изучены логические операции, производимые ученым при поиске нужной ему информации. … Вторая часть предмета – это довольно широкий комплекс вопросов, связанных с различными научными документами. Существующие виды научных документов сложились эмпирически, …. однако основания думать, что ученые располагают иными возможностями для распространения и сохранения во времени результатов своего труда, являются в значительной степени умозрительными. … Третий комплекс вопросов относится к созданию технических средств, необходимых для успешной научной деятельности».