
- •5 Введение
- •Глава 1
- •1.1. Информатика — состав и структура
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.3. Структуризация взаимосвязи информатики с предметной областью применения
- •1.4. Уровни информационных процессов
- •Глава 2
- •2.1. Текстовая информация. Модель документа
- •2.2. Языки разметки документов
- •2.3. Технологии xml
- •2.4. Текстовый редактор Word
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 3
- •3.2. Форматы записи-воспроизведения аудиосигналов
- •3.3. Технологии статических изображений
- •3.4. Программные средства обработки изображений
- •3.5. Цифровое видео
- •Глава 4
- •4.1. Оптическое распознавание символов (ocr)
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 5
- •5.2. Базы данных и субд
- •Логический файл
- •Логический файл
- •Очереди
- •Время установки головок чтения-записи
- •5.4. Анализ информации и хранилища данных
- •Глава 6
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 7
- •Глава 8
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
1.4. Уровни информационных процессов
Рассмотрим подробнее аспект уровней информационных процессов, описанный выше.
Информационные технологии
Для определения содержания и места информационных технологий рассмотрим следующие определения:
методология — объединенная единым подходом совокупность методов, применяемых для получения запланированного проектного результата;
технология — это представленное в инструктивной форме выражение знаний и опыта, позволяющее рационально организовать получение проектного результата путем выполнения некоторого процесса с использованием тех или иных средств, реализующих соответствующий метод;
технологический процесс — последовательность действий (согласованных, в том числе с условиями выполнения, технологических операций, использующих соответствующие средства), направленных на создание заданного (проектного) объекта:
технологическая операция представляет собой одно или несколько действий, направленных в рамках технологии на изменение состояния объекта или его взаимосвязи с окружением.
Технологическая операция характеризуется наличием:
одного или нескольких входных объектов;
выходного объекта — результата обработки;
управления (субъекта и средств) обработкой.
Практически любой конкретный технологический процесс можно рассматривать как часть более сложного процесса и совокупность менее сложных (в пределе — элементарных) технологических процессов.
Элементарным технологическим процессом можно назвать такой, дальнейшая декомпозиция которого приводит к потере признаков, характерных для метода, положенного в основу данной технологии. В этом смысле технологическая операция может рассматриваться как элементарный технологический процесс.
В каждом из перечисленных понятий явно или неявно присутствует понятие метод, имеющее общефилософское значение, как путь исследования или преобразования действительности, основанный на знании закономерностей развития этой действительности. Метод предполагает средства — то, с помощью чего осуществляется действие, реализующее метод, и способы — то, каким образом осуществляется действие. Обратим также внимание на то, что методы и средства могут использоваться в разных процессах и, следовательно, технологиях.
В рамках системного анализа сложные системы изучаются посредством разбиения на элементы: предполагается, что сложная система есть целое, состоящее из взаимосвязанных частей, которые не могут быть определены априорно, а строятся или выбираются в процессе декомпозиции (физической или концептуальной) исходной системы. Образующиеся в результате декомпозиции элементы обычно являются центрами некоторой активности (деятельности), и потому называются элементами деятельности. При рассмотрении сложных систем наиболее часто выделяют функциональные элементы/подсистемы (однородные группы решаемых задач или технологических процессов) и организационные (обособленные, автономные и централизованно управляемые как целеустремленные элементы сложной структуры).
Декомпозиция сложной системы на технологические подпроцессы приводит к понятию элемента (объект-процесс) технологии [32] (рис. 1.4):
у= Р(т, и). g = g{y, т, и).
Элементарный процесс состоит из двух контуров:
• рабочего (энергетического, материального), включающего рабочий вход и и рабочий выход у, функция преобразования входа в выход соответствует назначению данного элемента;
т
(управляющий вход)
и
>•
= Р(т,и)
Рабочий
вход
g
= Si)', '"■>')
Рабочий
g
(управляющий информационный выход)
Рис. 1.4. Общая структура элемента технологии
• управляющего (информационного), включающего рабочий вход т и выход g.
Первое из вышеприведенных соотношений связывает выход процесса у с управляющим воздействием и рабочим входом, а второе — отражает оценку процесса в тех или иных шкалах g (все переменные в общем случае могут быть векторами разных размерностей).
Рис.
1.5. Примеры
соединения элементов технологии в
комплексный процесс систему): а —
последовательное соединение по у
правляющим контурам; о — последовательное
соединение по рабочим контурам
б
Информационные
технологии
могут быть определены, как технологии,
полностью или частично состоящие из
элементарных процессов, в которых
рабочий контур образуют
информационные потоки
(массивы, данные, файлы) (табл. 1.3).
Таблица 1.3. Примеры элементов общих и автоматизированных информационных технологий |
||||
Тип технологии |
Рабочий вход |
Рабочий выход |
Управляющий вход |
Управляющий j выход |
Перевозка грузов на a/'м |
Расход топлива и др. материалов |
Доставка груза из пункта А в пункт В (тыс. км) |
Управление (средства управления)а/м |
i Приборы ! (показания приборов) |
АЭС |
Расход твэл |
Выработка электроэнергии (кВт ■ ч) |
Манипуляции поглощающими стержнями |
Показания приборов |
Шаг задания операционной системы OS/36D [31] |
SiS'jtl (входной файл) |
(выходной файл) |
SY5 (карты задания) |
SYSPRINT (протокол) |
Компиляция программы [9] |
Исходный модуль |
Результирующий (объектный) модуль |
Опции (ключи) компилятора |
Протокол трансляции |
Команда ОС MS DOS [31] copy \test. --■■ u |
Файл tes- . _:-:t |
Копия файла на дисководе а: |
Командная строка (ссру) |
Протокол на устройстве печати (ргг.) |
Команда format a: /v >prn |
Исходная дискета на устройстве а : |
Форматированная дискета а : |
Команда и ключ команды / v (запросить метку диска) |
Протокол форматирования на устройстве ! ргп |
Транзакция (обращение кАИПС или БД) |
База данных |
Результат поиска (записи или документы) |
Запрос на ЯЗ системы |
Протокол поиска |
Комплексы информационных технологий представляют собой процессы обработки, поиска, представления данных, результаты шагов которых (элементов технологии) определяются как запланированными типами обработки, выполняемой как на предшествующих/последующих шагах (рабочие контуры т—у и характер операции Р), так и фактически осуществившимися событиями (информация g).
Очевидно, не все из реальных элементов технологий предполагают обязательное наличие всех входов (выходов), указанных на рис. 1.4 (см., например, табл. 1.3).
Автоматизированные информационные технологии (АИТ) могут представлять собой как развитие неавтоматизированных (предметных) [17] технологий (если прототипы известны и существовали достаточно давно), так и новые способы и процессы обработки информации, ранее недоступные. АИТ являются
композициями четырех взаимосвязанных и взаимозаменяемых факторов (компонент): интеллектуальных усилий и навыков пользователя; технических средств обработки данных; программного обеспечения; информационных ресурсов.
Схема рис. 1.4 может быть детализирована в схему абстрактного технологического процесса, представленную на рис. 1.6.
Целевая обработка — это функционально-ориентированное преобразование получаемых или хранимых объектов обработки, обеспечивающее получение проектного результата под управлением субъекта (в качестве которого, так или иначе, выступает человек).
Информационные ресурсы — внешние по отношению к функциональному процессу источники информации, использование которых (обычно при управлении процессом) позволяет обеспечить эффективность целевой обработки.
Управление- ]
Субъект )
Рис.
1.6. Обобщенная схема абстрактного
технологического процесса
t
Таким образом, с точки зрения обобщенной схемы, представленной на рис. 1.6. ИТ можно подразделить на три основных класса:
технологии собственно обработки информации (ввода, обработки, хранения, поиска и передачи данных):
технологии человеко-машинного взаимодействия, реализуемые в интерфейсах;
инструментальные и другие вспомогательные технологии, позволяющие эффективно создавать и развивать ИТ предшествующих классов.
Отметим, что такое разделение, отражающее специализирован- ность используемых методов и средств, соответствует и «специализации» пользователей соответствующих технологий, где давно сложилось разделение на «разработчиков», «конечных пользователей» и «администраторов». С точки зрения этой «специализации» представляется целесообразным подразделять технологии на базовые, обеспечивающие и инструментальные.
Базовыми информационными технологиями (т. е. используемыми практически в любом процессе) являются те, которые в значительной степени определяются требованиями «архитектурного» уровня — принципами фон Неймана. Обработка разнородной по форме информации, представляемой разнотипными данными, предопределяет соответствующий ряд средств и технологий, ориентированных на форму представления информации и виды операций, как, например (табл. 1.4):
системы числовой обработки:
системы и технологии обработки текстов (текстовые процессоры, системы распознавания текстов);
средства обработки мультимедийной информации (например. растровой или векторной графики, звука, видео).
Обычно эти технологии реализуются в виде прикладных функционально-ориентированных продуктов, которые ассоциируются с понятием «технологии конечного пользователя».
Следующая группа — «обеспечивающие» информационные технологии — средства, непосредственно позволяющие эффективно достигать целевого, функционально значимого результата, включает:
технологии и системы управления данными и, в том числе — информационные системы:
средства и технологии распределенной обработки (сетевые технологии);
Таблица
1.4. Базовые
информационные технологии
N9
Тип
технологии
Входная
информация
Выходная
информация
Пример
программных средств
«Чистые
технологии» - обработка одного типа
данных
1
Обработка
текстов (документов)
Текст
.txt .doc, .rtf., .pdf
-
Lexicon,
Word, Adobe Acrobat
2
Обработка
таблиц
Таблица
,xsl, .dbf
-
Access,
Excel, Foxpro
3
Обработка
статических изображений
Картинка
.pix, .pcx, .bmp, .gif
-
Paint,
PhotoShop
4
Обработка
звукового сигнала
Оцифрованный
звук .wav, ,mp3
-
Magix
4 in One
5
Обработка
видео
Видеосигнал
,avi, .mpg, .dat, vob
-
Adobe
Premier, Pinnacle Studio
«Смешанные»
технологии — преобразование типов
данных
6
Распознавание
образов
Картинка
.pix, .pcx, .bmp, .gif
Текст
.txt, .doc, .rtf., .pdf
FineReader
7
Распознавание
голоса
Оцифрованный
звук .wav, ,mp3
Текст
.txt, .doc, .rtf., .pdf
«Змей-Горыныч»
(Dragon Dictate)
8
Чтение текста
Текст
.txt, .doc, .rtf., .pdf
Оцифрованный
звук .wav, ,mp3
Govorilka,
Speak & Mail
средства удаленного дост\тта (телекоммуникационные технологии);
средства и технологии человеко-машинного взаимодействия и интерфейсы конечного пользователя;
средства и технологии защиты информации.
Отметим, что перечисленные технологии являются, безусловно, важнейшими, но они относятся к «обеспечивающим», поскольку необходимость или необязательность их использования обусловлены характером задач пользователя или средой функционирования.
Эти технологии, имеющие инженерный, «системный» характер. ориентированы на администраторов.
Третью группу составляют «инструментальные» технологии, юеспечивающие жизненный цикл сахшх ИТ, как, например:
технологии проектирования и инструментальные средства разработки программного обеспечения;
технологии проектирования баз данных;
технологии реинжиниринга информационных систем.
Такая схема разделения ИТ на «базовые», «обеспечивающие» и «инструментальные» в целом не противоречит и другой классификации ИТ — с точки зрения объектов и методов. Здесь можно выделить следующие «страты»:
процессов обработки, передачи и управления данными (ввод, хранение, поиск, манипулирование), происходящих в основном без учета семантики и прагматики;
управления информацией — представление, извлечение, поиск, преобразование данных (ее представляющих) в контексте семантики и прагматики (в том числе для субъекта обработки — это получение, передача и использование знаний);
. управления взаимодействием с человеком (представление информации предметной области и результатов обработки, человеко-машинный диалог). Для случая инструментальных технологий (создания и использования целесообразных средств решения прикладных задач) — это методы и средства связывания технологий обработки данных и технологий обработки информации.
Информационные системы
Обобщенное определение информационной системы может быть построено, например, путем рассмотрения системы информационного обмена с декомпозицией ее на функциональные (основная и информационная деятельность) и организационные (потребители-поставщики информации и информационные системы) элементы [33]. Информационный обмен представляет собой сложный процесс, допускающий рассмотрение в разных аспектах, на различных уровнях иерархии описания, в свете постановки разнообразных исследовательских задач.
Взаимодействие потребителей-поставщиков информации. Элементы систем информационного обмена могут быть выбраны исходя из следующих рассуждений. Решещ^зсякри проблемы в общем случае включает следующие этапы (рис. 1.7).
1. Поиск информации (документов, сообщений). Внешняя среда—с точки зрения потребителя информации — является некоторым генератором потока сообщений, представленных на языке коммуникации, не тождественном «внутреннему языку» потребителя информации, связанному с конкретной решаемой пробле-
|
|
<- |
|
|
1. Поиск информации |
|
|
||
1 |
|
1 |
|
|
2. Интерпретация информации |
|
|
||
1 |
|
|
|
|
3. Решение задачи |
|
Информационные системы |
||
1 |
|
|
|
|
4, Создание сообщений |
|
|
||
i |
|
1 |
|
|
5. Распространение сообщений |
|
|
||
1 |
|
|
|
|
Информационная деятельность
Информационная деятельность
Рис 1.7. Структура или основные фазы деятельности потребителей-поставщиков
информации
мой. На этом этапе используются услуги различных информационных систем и неформальные каналы, доступные конкретному потребителю информации.
Интерпретация сообщений. В связи с конкретным характером решаемой задачи и профилем потребителя, имеет место уже
помянутое различие «языка коммуникаций» и «внутреннего ;зыка». Данный этап заключается в адаптации сообщений — излечении из сообщений информации, необходимой для решения поставленной задачи. Второй этап заканчивается созданием ин- : ормационного обеспечения (ИО) решаемой задачи. Информационным обеспечением является результат первого этапа: построение совместными усилиями потребителя и информационной системы некоторой совокупности сообщений, релевантных (потенциально полезных) для задач исследователя.
Решение задачи — используя ИО. а также собственные знания и опыт, и прилагая определенные усилия, потребитель (разработчик) создает новую информацию, составляющую решение. Эта информация зафиксирована на языке задачи и без дополнительных затрат труда не представляет ценности за пределами конкретной задачи.
Основная деятельность
Создание сообщений — поставщик информации осуществ- пяет интерпретацию полученного результата на «языке коммуни
каций», т. е. подготавливает сообщение в стандартной форме, одной из тех, которые приняты на данном этапе развития системы научных, деловых (и др. видов) коммуникаций вообще и информационных систем, в частности. Это может быть письмо, проект договора, статья, выступление на конференции, циркулярное сообщение по электронной почте и т. д.
5. Распространение сообщений. Создатели сообщений вступают в активное взаимодействие с системой коммуникации, затрачивая определенные усилия по вводу новой информации в один (или несколько) из доступных каналов коммуникации (пересылка документа, депонирование рукописи, публикация, аудиторное выступление или сообщение и т. д.). Эффективность данного этапа определяется как степенью усилий, предпринимаемых поставщиком информации, так и теми возможностями, которые ему предоставляет система коммуникации.
Очевидно, что в общем случае данные этапы реализуются сложным последовательно-параллельным образом (рис. 1.7 отображает обобщенную логику рассматриваемого процесса). Кроме того, в конкретных ситуациях процесс принятия и исполнения решения не обязательно включает все указанные этапы или, по крайней мере, не все они предполагают сравнимые затраты труда (времени).
Первый и пятый этапы являются этапами собственно информационной деятельности (ИД), поскольку их эффективность во многом определяется свойствами совокупности коммуникаций и информационных систем.
Третий этап — собственно основная деятельность (ОД).
Этапы второй и четвертый носят пограничный, диффузный характер и могут быть отнесены как к ИД, так и к ОД.
Приведенная линейная микроструктура (последовательность разных типов деятельности) представляет собой некоторый элемент деятельности (центр деятельности); в виде взаимосвязанной совокупности этих элементов может быть представлена любая, весьма сложная и разветвленная система (деятельность), функционирование которой опирается на информационный обмен. Примером может являться система наука — техника — производство.
Пересечение совокупности типов деятельности является организационным элементом системы информационного обмена (ОЭ). Примерами ОЭ, в зависимости от уровня декомпозиции исход
ной системы, являются отдельные исследователи, малые группы и коллективы, НИИ, отрасли, система национальной научной деятельности, другие формально и организационно структурированные элементы и объединения. Характерными признаками организационного элемента являются компактность (территориальная. административная, экономическая, физическая и т. д.) и гетерогенность (включение различных типов деятельности).
В противовес организационным могут быть выделены функциональные элементы, соответствующие определенному типу (этапу) деятельности (например, «сбор информации» или «передача информации»), В рассмотренном (рис. 1.7) примере выделяются, по меньшей мере, два функциональных элемента — ИД (по входу и выходу) и ОД. В системах, базирующихся на обмене информацией, целесообразно выделять два типа организационных элементов: включающие и не включающие ОД. Элементы первого типа являются потребителями-поставщиками (конечными) информации и могут взаимодействовать как непосредственно (реализуя информационную деятельность в собственных организационных рамках), так и через посредство элементов второго типа, которые представляют собой промежуточных потребителей-поставщиков информации, или информационные системы.
Наиболее общее представление о взаимодействии потребителей-поставщиков информации проиллюстрировано рис. 1.8. Уровни (каналы) взаимодействия могут быть разделены на три типа: • непосредственное рабочее взаимодействие (связь 3—3) представляет собой постоянный обмен информацией в группе или коллективе, в процессе совместной деятельности;
ис
|
1 |
||
|
1. ид |
|
|
|
2. О/ИД |
|
|
|
3. ОД |
|
|
|
4. И/ОД |
|
|
|
5. ИД |
|
|
|
1 |
1 |
|
||
|
5 |
|
|
|
4 |
|
|
|
3 |
|
|
|
2 |
|
|
|
1 |
|
|
1 |
|
ис
Рис. 1.8. Различные уровни взаимодействия потребителей-поставщиков
информации
непосредственное документальное взаимодействие (связь
2) заключается в оформлении результата и ограниченном контролируемом распространении (например — передача отчета или документации заказчику);
опосредованное документальное взаимодействие (связь
1) состоит в опубликовании результата и его последующем неограниченном перемещении по каналам ИС.
Управление информационным обменом на макроуровне может быть разделено на три типа задач, соответствующих данным каналам:
организация работ и взаимодействия соисполнителей при выполнении работ (связи 3—3);
маркетинг — поиск заказчиков на результат работ, получение заказов, связь с заказчиками, оформление и передача результатов, поиск прочих возможных потребителей результатов (связи 4—2);
управление документальными потоками — распространение информации в документальной форме по каналам обобщенной ИС, решение задач повышения полноты, точности, оперативности информационного обмена и обслуживания (связи 5—1).
Обобщенными информационными системами в рассматриваемом случае могут являться (в зависимости от уровня рассмотрения):
специалисты-аналитики или информаторы;
информационно-аналитические подразделения организаций;
информационные службы или институты информации;
мировые информационные системы и сети информационного обмена.
Автоматизированная информационная система (АИС) таким образом может быть определена как комплекс автоматизированных информационных технологий, входящий в состав обобщенной ИС и предназначенный для информационного обслуживания — организованного непрерывного технологического процесса подготовки и выдачи научной, управленческой и др. информации потребителям, используемой для принятия решений, в соответствии с их нуждами для поддержания эффективной деятельности.
Компоненты и структуры АИС. Рисунок 1.9 отображает структуру типичного совокупного технологического процесса АИС, или представление АИС как совокупности функциональных под-
Другие ИС, АИС, внешние БД
Сбор данных
Оператор
Администратор
Пользователь
Ввод
данных
Обработка
машинная
1
База
данных
Хранение,
обновление, поддержка
|
Модель
Поиск
информации
|
объекта
Формирование
выходных
документов
Анализ
данных
Принятие решении
Рис. 1.9. Основные технологические процессы АИС
систем — сбор, ввод, обработка, хранение, поиск, распространение информации.
Очевидно (как и в ранее рассмотренных структурах), многие элементы рис. 1.9 являются альтернативными:
• модель объекта может отсутствовать либо отождествляться с базой данных (БД), которая часто интерпретируется как информационная модель предметной области, структурная (для случая табличных, фактографических БД) или содержательная (для случая документальных БД). В экспертных системах (ЭС) в качестве модели объекта (предметной области) фигурирует база знаний (БЗ). представляющая собой процедурное развитие понятия БД (БД, по своей сущности, непроцедурный объект): . модель объекта и БД могут отсутствовать (а соответственно и процессы хранения и поиска данных), если система осуществляет динамическое преобразование информации и формирование выходных документов, без сохранения исходной,
промежуточной, результирующей информации. Если преобразование данных также отсутствует, то подобный объект информационной системой не является (он не выполняет информационной деятельности), а должен быть отнесен к другим классам систем (например, канал передачи информации и т. п.);
процессы ввода и сбора данных являются необязательными, поскольку вся необходимая и достаточная для функционирования АИС информация может уже находиться в БД и составе модели, и т. д.
Основные типы АИС
К наиболее распространенным и перспективным типам относятся (табл. 1.5):
фактографические АИС;
документальные;
интеллектуальные (экспертные);
гипертекстовые.
Это определяется следующими факторами [14]:
системы появлялись и развивались именно в данной исторической последовательности;
более ранние типы систем (фактографические, документальные) являются, как правило, платформой и средой для реализации более поздних (экспертные, гипертекстовые);
перечисленные типы характеризуют следующие отличительные черты:
распространенность (в статистике мировых информационных ресурсов документальные и фактографические БД занимают 1- и 2-е места);
перспективность (интеллектуальные системы успешно осваивают новые области применения):
гипертекстовые системы являются основой мировой информационной сети WWW (Word Wide Web) — наиболее популярной составляющей Internet.
При этом хотелось бы отметить, что в традиционном понимании выражение «информационная система» (особенно «автоматизированная информационная система» или «автоматизированная информационно-поисковая система — АИПС») обычно ассоциируется с документальными системами (базами данных);
Таблица 1.5. Сравнительные характеристики основных типов АИС |
||||
Атрибуты систем |
|
Типы систем |
|
|
фактографические |
документальные |
интеллектуальные |
гипертекстовые |
|
Модель (структура) предметной область |
Структура БД(логическая и физическая) |
Содержание БД (структура стандартна) |
Структура и содержание БД (БЗ) |
Структура и содер- : жание БЗ (ГБ) |
Информационная совокупность |
База данных(иногда файловая система ОС) |
База данных |
, Сеть связей (гиперБаза знании ;, база - ГБ |
|
Единица информации |
Запись(агрегат данных жесткой структуры) |
Документ (агрегат данных диффузной структуры) |
Факт (константа), высказывание(переменная) |
Узел сети (запись, документ, факт), связь(ссылка,тематическая, смысловая, родовидовая, причинно-следственная) |
Физическая среда хранения информации |
Файловая система ОС |
Файловая система или фактографическая БД |
Файловая система ОС, фактографическая (или другого типа) БД |
Файловая система, БЗ, БД |
Ввод информации |
Загрузка БД |
Загрузка БД |
Подсистема приобретения знаний (Knowledge acquisition) |
Загрузка файлов или БД, или БЗ |
Вывод информации (входной
язык)
Пользовательский интерфейс (язык запросов)
Пользовательский интерфейс (информационно-поисковый язык)
Интерфейс пользователя, подсистема разъяснения результатов (explaining subsystem)
Навигатор сети или язык запросов
ОС
или СУБД
СУБД или программная оболочка АИПС
СУБД или программная оболочка ЭС (машина логического вывода - Inference engine)
Гипермедиа-машина навигации
Программные средства реализации
Табличные СУБД и системы программирования с элементами СУБД - ADABAS, FoxPro, Oracle, MS SQL SERVER
Программные оболочки АИПС-DPS, STAIRS, ISIS, IRBIS
Оболочки ЭС (Shells) - EMYCIN, EXPERT, OPS, HEARSAY, EXSYS, Insight, ExpertEase
NoteCards, Tektronix Neptune, ГипСи, ГиперМе- !тод, ГИПЕРНЕТ, Мета Дизайн
термин же «база данных», как правило, ассоциируется с фактографическими, управленческими системами, задачами типа АСУ. Хотя, конечно же, и те и другие типы систем являются информационными и обычно строятся на основе концепции баз данных, т. е. физически включают базы данных в свой состав.
В этой традиционной интерпретации находит свое отражение то обстоятельство, что в фактографических системах модель предметной области заключена в структуре БД. и потому основное внимание сосредоточивается на проблеме проектирования БД, в документальных же системах моделью является наполнение, содержание БД, в том числе — словаре!), тезаурусов и т. д., поэтому основное внимание уделяется языковым, семантическим проблемам. (Эти и другие различия указанных типов систем описываются в табл. 1.5.)
Типология БД
Классификация баз и банков данных может производиться по различным признакам, среди которых выделяют следующие.
По форме представляемой информации выделяют:
фактографические;
документальные;
мультимедийные, в той или иной степени соответствующие цифровой, символьной и другим (не цифровой и не символьной) формам представления информации в вычислительной среде. К последним можно отнести картографические, видео, аудио, графические и другие БД.
По типу хранимой (немультимедийной) информации выделяют:
фактографические;
документатьные;
лексикографические БД.
Лексикографические базы — классификаторы, кодификаторы, словари основ слов, тезаурусы, рубрикаторы и т. д., обычно используемые в качестве справочных совместно с документальными или фактографическими БД.
Документальные базы по уровню представления информации подразделяются на: полнотекстовые (так называемые «первичные» документы), библиографические и реферативные («вторичные» документы, отражающие на адресном и содержательном уровне первичный документ).
По типу используемой модели данных выделяют три классических класса БД:
иерархические;
сетевые;
реляционные.
Развитие технологий обработки данных привело к появлению постреляционных, объектно-ориентированных, темпоральных БД, в той или иной степени соответствующих трем упомянутым классическим моделям.
По топологии хранения данных различают локальные и распределенные БД.
По типологии доступа и характеру использования хранимой информации БД могут быть разделены на специализированные и интегрированные.
По функциональному назначению (характеру решаемых с помощью БД задач и, соответственно, характеру использования данных) выделяют операционные и справочно-информацион- ные БД.
К последним можно отнести ретроспективные БД (электронные каталоги библиотек, БД статистической информации и т. д.), используемые для информационной поддержки основной деятельности, и не предполагающие внесение изменений в существующие записи, например по результатам этой деятельности. Операционные 2>Д предназначены для управления различными технологическими процессами. В этом случае данные не только извлекаются из БД, но и изменяются (в том числе добавляются), в том числе в результате этого использования.
По сфере возможного применения различают универсальные и специализированные (или проблемно-ориентированные) системы.
По степени доступности выделяют общедоступные и БД с ограниченным доступом пользователей. В последнем случае говорят об управляемом доступе, индивидуально определяющем не только набор доступных данных, но и характер операций, которые доступны пользователю.
По назначению содержащейся информации выделяют БД:
деловой информации (социальная, коммерческая и другая информация, кадастры, регистры);
информации для специалистов (экономическая, правоохранительная и др. информация);
массовой информации.
По способу доступа существуют БД:
размещенные на хостах (доступные через сети);
тиражируемые в коммуникативных форматах;
тиражируемые с программными средствами (включая CD-ROM);
локальные.
Представленная классификация не является полной и исчерпывающей. Она в большей степени отражает исторически сложившееся состояние дел в сфере деятельности, связанной с разработкой и применением БД.
Информационные ресурсы
Кругооборот информационного ресурса, как и всякого иного продукта человеческой деятельности, подчиняется естественному циклу: создание — распространение — потребление. Несмотря на то, что информация физически не разрушается при потреблении и не исчезает (в отличие от материальных товаров и ресурсов), при рассмотрении процессов в длительной перспективе становится очевидным, что информационный ресурс не избегает участи всего сущего и, переходя в новые формы знания, практически бесследно в них растворяется (кому сейчас интересны тексты библиотек программ на Алголе, бывшие бестселлерами всего 40 лет назад !?).
Традиционный цикл информационного обмена, существовавший в течение столетий, представлен на рис 1.10, а и заключается в последовательности процессов концентрации—рассеяния совокупных (составных) информационных потоков (в данном случае образуемых печатными изданиями первичных документов). Основной поток здесь идет по цепочке автор — издательство — библиотека — читатель, однако существуют и обходные пути: автор — читатель', издательство — читатель (подписка), которые также подчиняются принципу концентрации—рассеяния.
Переход в начале 70-х гг. информационных служб на дублирование в машиночитаемой форме сначала вторичных (реферативные журналы, каталоги, справочные издания), а затем и первичных (полнотекстовых) документов, не нарушая в принципе обшей структуры (последовательно-параллельное сосуществование процессов концентрации—рассеяния), вносит определенное разнообразие (рис 1.10, о).
Поставщиками содержания теперь являются любые из участников процесса рис 1.10, а\ автор (обычно корпоративный автор — организация или фирма, выполнившая работу), издательство или библиотека. Издание баз данных и онлайновое обслуживание также никому не возбраняется. Например, одна из крупнейших информационных систем по естественным наукам — INSPEC — развилась из библиотечной службы вуза (IEE — Institution of Electrical Engineers. Великобритания). Информаци- viHHbie сети, представляющие собой коммуникационную среду
|
г. |
гг |
|
|
г: |
Ч t ? |
ч |
t |
А |
? |
t |
? + ч |
ж |
t |
ч |
|
? |
а с |
» |
• |
|
|
г |
i <? i % |
* <р |
+ |
|
+ |
1 |
© © © © |
© © |
© а |
|
© © |
© |
©
Рис.
1.10. Уровни
информационных ресурсов и средств
доступа к ним: уровень традиционных
публикаций: б — уровень электронных
публикаций: в
— Internet;
г
— взаимодействие уровней
для конечного пользователя, часто входят в состав издательств или распространителей БД. образуя интегральные распределенные информационные службы. Таким образом, электронная инфраструктура образует относительно самостоятельный слой (рис. 1.10, г), не являясь зеркальным подобием традиционных коммуникаций.
Появление в конце 80-х — начале 90-х гг. нового фактора — Internet (рис. 1,10. в) с его информационными ресурсами/сервисами (FTP, Gopher, Usenet, IVWIV) — дополняет общую картину.
Удешевление и повсеместное распространение коммуникационного оборудования, услуг связи (с повышением их производительности), а также высокая степень стандартизации форматов, протоколов передачи данных и программных средств — все это привело к интеграции информационных сетей разной физической организации и пропускной способности в однородную среду, в которой взаимодействуют все агенты, обозначенные на рис 1.10, а, б и «прозрачность» которой во всех направлениях со временем быстро возрастает.
Таким образом, в настоящее время наблюдается 3-слойная инфраструктура информационных ресурсов (рис 1.10, г), в которой:
каждый последующий уровень инкапсулирует (поглощает) предшествующий в качестве потребителя-источника информации и добавляет новых участников коммуникации;
характер коммуникации варьируется от структурированной, но замедленной (уровень 1). до «бурного потока» (уровень 3);
со временем происходит постепенный переход основной активности от нижних слоев к верхним.
В табл. 1.6 приведены основные классы информационных ресурсов.
В последующих главах настоящего пособия будут рассмотрены:
технологии конечного пользователя (обработка документов, мультимедиа информации, кросс-технологии), доступ к информационным ресурсам;
технологии разработчиков и администраторов информационных ресурсов и систем (организация доступа к локальным и распределенным информационным ресурсам, информационный поиск, защита информации).
Таблица
1.6. Краткие сведения
о типах информационных ресурсов по
отраслям
Тип
информации
:
Поставщик Потребители _ гп Содержание
i
, , Примеры БД : содержания \ (задачи)
Хост-служба
Web-серверы
Биржевая
и финансовая
BOND
BYER
Индексы
Биржи, бан- : Ьюджетиро- вишЕ55
г
■ вание; управ- „>Tr,,.
рынка, коти- ки, службы DATELINE;
-
лениепорт- ,.. .. ровки, цены, финансовой
, FINANCIAL а д. фелем; ана-
обзоры информации , TIMES лиз
бумаг ONLINE
Dialog,
Nexis, GBI
FIIC
-
http://www.fid
-inv.com
Экономическая,
демографическая статистика
Первичная
и ABI INFORM;
вторичная;
Переписи: LEGAL
националы-
опросы, ана- ., RESOURCES Маркетинг
ная;
регио- литические INDEX,
нальная ста- исследования MANAGEMEN
тистика Т CONTENTS
Dialog,
GBI
Economic
Bulletin
Board
-
http://www.st
at-usa.gov/be
n/ebbhome.ht
m
Коммерческая
D&B
Данные
о 1 Исследова- INTERNATION
предприяти- : Аналитиче- !
ния рынка, AL MARKET, ях,
товарах, ские службы 1 оценка парт-
MOODIES услугах :
неров CORPORATE
NEWS
Dialog,
GBI
Buisiness
Yellow
Pages
-
//www.chba.u
h.edu/ylowpg
es.htm
Деловые
новости
Состояние
Службы рынка, собы- ! фильтрации,
тия в области агентства но- экономики
востей
.
, ! BUISINESS Общии биз-
;W|REJNT
неС
TODAY
Dialog,
NEXIS
USA
Today-
/www/ustoday
.com
Научно-техническая
Фундамен-
Центры НТИ, Иссладова. |NSpEC;
тальные, ; издательст- AGR|c0lA;
прикладные ва, библиоте-j
^ CHEMNAME; науки ки
COMPENDEX
Dialog,
STN, ORBITI
МЦНТИ
- http://icsti.su;
ВИНИТИ - //viniti.msk.su
Правовая
:
Законода-
Норматив-
|
тельные ор- но-правовые , ..
ганы,
Мин-
акты
юст
CIS
Правоприменение,
пра- CONGRESS воохрана
RECORDS
Dialog,
Lexis
Гарант-сервис
//www.garant.
msu.ru
Медицинская
Информаци-
Медучрежде-
шны ен. MffiuNE
ния,
болезни, библио_ Диагностика,
CANCERUTi
лекарства,
'лечение - _ теки, госпи- TOXLINE
яды
тали
Dialog,
STN
MedNet
- //www.medne
t. com
Потребительская
и развлекательная
Образование,
Справочные : MAGAZINE
музыка му- 6ы |Д ,NDEXi
l Dialog
зеи,
библио- ; ; сопот реждения : SPUKI
теки, кино 1 :
Enjoi
-
http://www.en
joi.ru/
Бытовая
Погода,
ту- Информаци- NATIONAL
ризм,
спра- онныеслуж- Досуг NEWSPAPER
Dialog, Nexis
вочники
бы ! INDEX
Погода
России
//meteo.infos
pace.ru
Контрольные вопросы
1 . Охарактеризуйте соотношение понятий «информация», «данные», «знания».
2. Дайте определение понятия «информация». В. Охарактеризуйте прагматические свойства информации.
Перечислите атрибутивные свойства информации.
Назовите и охарактеризуйте формы концентрации информации.
Что представляют собой факторы информатизации?
Какие периоды развития информатизации могут быть выделены?
Что такое уровни информационных процессов?
Дайте определение технологии и информационной технологии.
Что такое элемент технологии? Приведите примеры.
Перечислите основные классы информационных технологий.
Что такое обобщенная система информационного обмена?
Назовите уровни взаимодействия потребителей-поставщиков информации.
Какова структура технологического процесса АИС?
Назовите основные классы АИС.
Перечислите основные классы баз данных.
Что такое информационные ресурсы? Приведите примеры.
Дайте классификацию информационных ресурсов.