
«Основные принципы проектирования банков данных фактографических АИС. Понятие информационно-логической схемы предметной области, схемы базы данных, внутренней схемы базы данных»
Введение
Фактографические информационные системы (ИС) – накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров или некоторая их совокупность отражают сведения по какому-либо факту, событию, персоне, отделённому от всех прочих сведений и фактов.
Фактографическая АИС, например, накапливают сведения по лицам, при этом каждому лицу соответствует запись, составленная из определённого набора реквизитов.
Одной из наиболее трудоемких и сложных задач при создании АИС является проектирование банка данных как основы подсистемы представления и обработки информации. Логическая и физическая структуры банка данных отражают представление разработчиками и пользователями информационной системы той предметной области, сведения о которой предполагается отражать и использовать в АИС.
Основные принципы проектирования банков данных фактографических аис
Проектирование банков данных фактографических информационных систем осуществляется на основе формализации структуры и процессов предметной области АИС, и, в соответствии с уровнями представления информации в АИС, включает концептуальное и схемно-структурное проектирование.
В организационном плане в группе разработчиков банка данных выделяют специалистов по формализации предметной области, специалистов по программному обеспечению СУБД, а также технических дизайнеров и специалистов по эргономике. Специалисты no формализации предметной области (их еще называют формализаторами или постановщиками задач), как правило, возглавляют весь проект создания АИС и обеспечивают функции взaимодейcтвия с заказчиком. К данной категории специалистов предъявляются наиболее сложные профессиональные требования. С одной стороны, такие работники должны быть специалистами в сфере программного обеспечения АИС (операционные системы, СУБД и т. д.), а с другой стороны, они должны хорошо представлять (или освоить) конкретную предметную область АИС, т. е. быть (временно стать) бухгалтерами, экономистами, делопроизводителями и т.п. Специалисты по программному обеспечению СУБД относятся к категории профессиональных программистов, определяют выбор СУБД и обеспечивают построение ее средствами автоматизированного банка данных по разработанной постановщиком задачи (формализатором) концептуальной схеме. Технические дизайнеры и cneциaлисты по эргономике обеспечивают эстетичную и эргономичную сторону интерфейса с пользователем в АИС при вводе, обработке и поиске данных.
Этапы концептуального проектирования:
1 этап: обзор и изучение области использования для формирования общего предоставления предметной области. На этом этапе осуществляется изучение предметной области разработчиком в непосредственном взаимодействии с заказчиком.
2 этап: формирование и анализ круга функций и задач ИС. На втором этапе определяется перечень пользователей системы, и уточняются их информационные потребности.
3 этап: определение основных объектов сущности предметной области. На этом этапе определяется объекты-сущности предметной области, отношения между ними, перечень атрибутов, характеризующих те или иные объекты-сущности.
4 этап: формализованное описание предметной области. На этом этапе формализованное описание концептуальной схемы осуществляется посредством одной из её семантических моделей данных. Формализованное представление объектов и отношений предметной области - инфологической схемой. Данная схема наиболее часто представляется графически в виде модели объектов связи или ER – модели или ER – диаграммы. Наиболее популярными являются разновидности уже упоминавшейся ER-модели, использующие для графического представления структуры данных аппарат диаграмм Бахмана. Формализованное описание ER-модели было предложено в 1976 году Петером Пин-Шен Ченом. Основными компонентами структурной составляющей семантической модели Чена являются сущности, наборы сущностей, атрибуты сущностей, наборы значений атрибутов, ключевые атрибуты сущностей, связи, виды связей, атрибуты связей, наборы связей, ключевые атрибуты связей.
Оригинальные предложения П. Чена по графическому обозначению в диаграммах Бахмана сущностей и связей претерпели изменения. Сейчас на ER - диаграмме объекты-сущности изображают прямоугольной (иногда с атрибутами) а связи – линиями с соответствующими символами. Возможны различные варианты связи: один к одному; один ко многим; многие ко многим.
Формализованное описание концептуальной схемы БД осуществляется на бумаге и служит основой эскизного проекта.
Следующим шагом в проектировании является построение средствами СУБД схемы банка (базы) данных, которое в большинстве случаев производится «вручную». Иначе говоря, средствами СУБД, поддерживающей ту или иную модель данных, скажем реляционную, создается структура банка данных, соответствующая концептуальной схеме. При этом при переходе от концептуального к схемно-структурному проектированию может иметься разрыв в семантических средствах выражения сущностей, атрибутов, связей и т. д. Адекватность реализации концептуальной схемы банка данных определяется, как уже отмечалось, эвристически и эмпирически в ходе отладки и дальнейшей эксплуатации банка данных.
Схемно-структурное проектирование
Наиболее часто концептуальную модель можно отобразить на реляционную модель данных и соответственно выбрать для реализации реляционную СУБД.
Схемой БД называется логическая структура данных.
Проектирование схемы реляционной БД:
определение перечня таблиц;
определение перечня полей, ключевых полей каждой таблицы, установление связей между таблицами через внешние ключи;
разработка списков (словарей) для полей с перечислительным характером значений данных;
установление ограничений целостности по полям таблиц и связям. Дополнительно в реляционных СУБД могут устанавливаться требования уникальности значений и по другим (не ключевым) полям через создание для них индексов в режиме без повторов (UNIQUE), а также установления режима обязательного заполнения в строках-кортежах определенных полей (режим NOT NULL).
Вместе с тем современные СУБД могут предоставлять и более развитые возможности установления ограничений целостности данных. Можно определять допустимые диапазоны значений полей (например, значение поля «Оклад» не может быть меньше величины минимального размера оплаты труда).
нормализация таблиц, доработка перечня таблиц и их связей. С содержательной точки зрения нормализацию таблиц можно рассматривать как некоторую доработку концептуальной схемы базы данных в тех случаях, когда концептуальное проектирование банка данных произведено без достаточной проработки, и в ходе предварительного проектирования созданы таблицы, отражающие данные сразу нескольких объектов-сущностей предметной области АИС.
С формальной точки зрения нормализацию можно представить как последовательный процесс разбиения и преобразования некоторого небольшого исходного набора таблиц для построения набора взаимосвязанных таблиц в нормальных формах. Основатель реляционной модели данных Е. Кодд выделял три нормальные формы — первую, вторую и третью. Этот набор в дальнейшем был дополнен нормальной формой Бойса-Кодда, и далее четвертой и пятой нормальными формами.
Результатом проектирования и нормализации таблиц является законченная схема (логическая структура) базы данных. Технологически описание схемы базы данных помещается в каталог базы данных, который в реляционных СУБД, в свою очередь, представляет также таблицу, структура (поля) которой описывает объекты базы данных (таблицы), их названия, поля, параметры и т. д. Обычно каталог базы данных хранится в файле БД вместе с данными. В определенных случаях (системы «Клиент-сервер», распределенные системы, системы на основе репликации) может устанавливаться специальный режим размещения и доступа к каталогу базы данных.
Для повышения эффективности схемно-структурного проектирования банков данных на рынке программных средств СУБД появился специальный класс программ, называемых CASE – системами (системы автоматизированного проектирования). Наиболее известными из них являются Designer 2000 компании «Оrасlе», ErWin компании «LogicWorks», PowerBulder компании «PowerSoft». Такие системы предоставляют проектировщику банка данных средства концептуального проектирования баз данных на основе техники семантического моделирования. При этом широко используются средства визуализации определения и описания информационных объектов, связей и их атрибутов, что делает процесс проектирования максимально наглядным и позволяет проектировщику сосредоточиваться на смысловом аспекте структуры банка данных. Разработанная таким образом концептуальная схема банка данных транслируется CASE-системой в схему соответствующего реляционного банка, избавляя проектировщика от утомительных процедур «ручного» перевода концептуальной (семантической) схемы в реляционную.