
6. Накопление и представление информации
6.1. Средства накопления данных
Средства накопления данных в условиях новой информационной технологии должны строиться на концепции данных. На физическом уровне они воплощаются в виде автоматизированного банка данных (АБД), представляющего собой совокупность базы данных и системы управления. В базе данных моделируется информация о предметной области пользователя, описание которой включает хранимые данные и процедуры их обработки, а также всевозможные отношения между ними. АБД реализуется на совокупности технических и программных средств, обслуживается административным персоналом и предназначается для коллективного накопления и использования данных. Поэтому наряду с наличием внешних моделей пользователей должно существовать описание банка данных в виде информационной модели предметной области независимо от прикладных задач пользователя. Такое описание получило название концептуальной модели. Оно предоставляет любому пользователю единую точку зрения на построение банка данных, т. е. позволяет применить типовые модели структурированных данных, к которым относятся иерархическая, сетевая и реляционная модели. Концептуальная модель должна быть инвариантной к средствам ведения и обслуживания банка данных, она находит формализованное отображение в канонической структуре информационной базы, под которой понимается обобщенный граф предметной области, получаемый на основе объединения графов информационных структур пользователей. Дальнейший переход от концептуального к внутреннему уровню представления означает разработку логической и физической структур данных. Логическая структура строится в соответствии с требованиями пользователя и ограничениями используемой СУБД. Ею определяются принципы объединения записей в массивы с упорядочением их по выделяемым ключевым признакам. Физическая структура зависит от используемых технических и программных средств. Она задает организацию хранения данных в памяти ЭВМ, от физической структуры зависят количественные характеристики процесса накопления данных и методов доступа к ним.
Рис.6.1. Обобщенная схема функционирования автоматизированного банка данных
На рис.6.1 представлена обобщенная схема функционирования АБД. Логическая и физическая структуры данных поддерживаются СУБД, взаимодействующей с прикладными программами (ПП) и операционной системой (ОС) ЭВМ. База данных (БД) реализуется на средствах памяти ЭВМ и включает в себя входные, промежуточные и выходные данные, связанные с процессом автоматизированного управления, справочные и служебные данные, архив, библиотеки программ. С АБД взаимодействуют пользователи, прикладные программисты, администратор. Пользователь (П) обращается в банк на специальном языке запросов (ЯЗ). Любой запрос проходит этап предварительной обработки (ПО), на котором осуществляется синтаксический и логический контроль.
При отсутствии ошибок осуществляется интерпретация запроса (ИЗ), т.е. устанавливается его вид и определяются последующие действия с данными.
Запрос может поступить на формирование новых записей в массиве, на реорганизацию имеющихся, на выдачу документов и т.д. На этом этапе запрос переводится на язык описания данных (ЯОД). Прикладная программа пользователя (ПП) устанавливает в рабочей области значения параметров обращения к базе данных, определяющие на логическом уровне требуемые типы данных. Обращение пользователей анализирует СУБД и на физическом уровне реализует необходимый способ доступа к базе данных.
Поиск данных (ПД) осуществляется под действием команд операционной системы, благодаря чему данные пересылаются в рабочую область соответствующей прикладной программы пользователя. Найденные данные контролируются, после чего осуществляются редакция ответов (РО) и выдача данных на печать пользователю. Особая роль в АБД, принадлежит администратору (А), который осуществляет координацию всего процесса функционирования банка и выполняет неформализуемые операции. В соответствии с требованиями пользователей администратором создаются новые базы данных, им осуществляются реорганизация базы, генерация и развитие СУДБ, а также предпринимаются меры в критических ситуациях при возникновении сбоев в процессе функционирования. Таким образом, внешняя модель пользователя находит отражение в языке запроса. Концептуальную модель реализуют СУБД и прикладная программа пользователя. Логическая и физическая структуры организации данных определяются как программными, так и техническими средствами ЭВМ. Развитие АБД тесно связано с совершенствованием средств вычислительной техники и операционных систем ЭВМ. Типовой характер получили СУБД, которые далее рассматриваются в составе системных программных средств информационной технологии.
С развитием персональных ЭВМ и объединением их в локальные сети наблюдается тенденция создания распределенных банков данных. Распределенное накопление данных вызывается следующими причинами:
1) пользователь стремится использовать данные непосредственно в месте их накопления. Передача данных в центральную базу оказывается нецелесообразной, формируется локальная база данных;
2) общение пользователя с создаваемой им локальной базой возможно на некотором псевдоестественном языке при наличии определенной организуемой пользователем процедуре поиска. Эта процедура оказывается неэффективной при работе многих пользователей с централизованной базой данных;
3) достаточно простые структуры данных, формируемые пользователем, не требуют применения дорогостоящих и сложных СУБД;
4) требуемые характеристики физической организации локальной базы достигаются при меньших экономических затратах, повышается оперативность доступа и упрощается реорганизация локальной базы.
Рис.6.2. Обобщенная структура распределенного банка данных на кольцевой локальной сети
Объединение локальных баз данных в распределенный банк оказалось возможным на основе развития информационно-вычислительных сетей. Распределенный банк данных (РБД) содержит совокупность локальных баз, физически реализованных на различных ЭВМ, территориально объединенных сетью и поддерживаемых одной или несколькими СУБД. Благодаря СУБД пользователь может обращаться к любой части распределенной базы, в том числе территориально удаленной от него и сформированной другим пользователем.
Объединяемые в рамках одной сети локальные банки данных могут быть неоднородны по структуре, в основе их построения возможна реализация разных логических моделей данных, поддерживаемых различными типами СУБД. Интеграция неоднородных банков данных осуществляется с использованием общей модели данных, получаемой как расширение исходных моделей. Известны методы отображения моделей данных на реляционную модель. Архитектура РБД весьма разнообразна.
На рис.6.2 представлен вариант РБД на базе кольцевой локальной сети. Локальная база данных (ЛБД) поддерживается собственной СУБД. Пользователь с помощью прикладной программы обращается к СУБД, которая на основе операционной системы ЭВМ обеспечивает поиск данных в информационной базе. Если в собственной локальной базе данные не обнаружены, то возможно их извлечение из других баз путем включения прикладных программ j пользователей. Для этого каждая локальная база данных с помощью устройств доступа (УД) и соединительных элементов (СЭ) включается в локальную сеть (ЛС). Рассмотренная архитектура РБД может изменяться путем исключения СУБД и соответствующих прикладных программ у отдельных пользователей.
АБД входят в состав наиболее трудоемкой и дорогостоящей части автоматизированной системы - информационного обеспечения, а поэтому проектирование банка данных должно осуществляться на базе новой информационной технологии. Процесс проектирования включает в себя типовые стадии и начинается с предпроектного анализа, в ходе которого устанавливаются требования каждого пользователя и формируется модель предметной области. На этапе концептуального проектирования эти требования интегрируются в виде концептуальной модели, которая отображает желания пользователей и задает идеологию построения информационной базы. В ходе логического проектирования разрабатывается версия концептуальной модели, которая поддерживается используемой СУБД и является логической моделью организации данных. На этапе физического проектирования логическая модель преобразовывается в физическую, которая задает характеристики банка данных. В процессе проектирования могут быть использованы различные методы, которые реализуются в структуре инструментальных программных комплексов.