- •Определения и понятия илм
- •Информационные объекты
- •Требования нормализации информационных объектов
- •Связи информационных объектов
- •Построение информационно-логической модели предметной области
- •Выделение информационных объектов
- •Правила выделения информационных объектов
- •2. По функциональным связям для каждого зависимого реквизита установить все реквизиты (ключевые), которые в совокупности однозначно определяют зависимый реквизит.
- •Определение структурных связей и построение илм
- •Графическое представление канонической илм
- •Логическая структура реляционной базы данных
- •Контрольные вопросы
анализ предметной области и определение
логической структуры базы данных
Лекция 11. Разработка базы данных. Информационный анализ предметной области и определение
логической структуры базы данных
Информационный анализ предметной области
Разработка базы данных производится на основе обследования предметной области (ПО) и является результатом информационного анализа и построения модели данных предметной области. Завершается разработка определением логической структуры БД.
На основе обследования составляется описание ПО и документов, которое должно охватывать весь спектр реальных объектов, процессов и явлений, т.е. сущностей, данные о которых должны быть размещены в БД. Обследование начинается с определения состава данных ПО, подлежащих хранению в базе для обеспечения задач и запросов пользователей. Основным источником данных являются справочные, плановые и оперативно-учетные документы. Таким образом, определению структуры базы данных предшествует выявление информационных потребностей.
Далее необходимо осуществить информационный анализ с целью формализации данных, необходимой для их организации и обработки во внутримашинной сфере. При этом должен быть произведен семантический анализ данных и выявлены логические взаимосвязи. В результате данные должны быть структурированы. Удобным способом представления структурированных данных является информационно-логическая модель данных предметной области (ИЛМ ПО). Такая модель является основой для определения логической структуры БД в соответствии с типом модели данных, поддерживаемой СУБД.
Для получения проекта структуры реляционной БД в процессе построения ИЛМ должна быть произведена нормализация данных предметной области, которая позволит получить каноническую форму ИЛМ. Разработка ИЛМ ПО базируется на описании данных и документов предметной области, полученном в результате ее обследования. В процессе информационного анализа для построения канонической ИЛМ необходимо определить структуру и связи нормализованных информационных объектов. На основе канонической ИЛМ легко получить логическую структуру реляционной БД. Такая БД будет отвечать требованиям отсутствия избыточности (дублирования описательных данных), однократного ввода, и в ней может поддерживаться целостность (непротиворечивость) данных.
В результате проектирования должна быть определена структура реляционной базы, т.е. состав реляционных таблиц, их структура и логические связи таблиц. Структура реляционной таблицы определяется составом столбцов (полей), их последовательностью, типом и длиной (размером) данных каждого столбца, а также ключом таблицы (уникальный идентификатор записей).
Варианты подходов к проектированию БД. При проектировании базы данных могут использоваться два подхода. При первом подходе сначала устанавливаются основные задачи, для решения которых строится база, и потребности задач в данных. Строго в соответствии с потребностями выявляются информационные объекты, из которых должна состоять БД. При втором подходе изучается предметная область, производится анализ ее данных, и устанавливаются типовые объекты предметной области. Возможно сочетание обоих подходов.
При разработке ИЛМ в соответствии с первым подходом сначала осуществляется выявление форм документов – источников, содержащих необходимые данные. Данные в документах представлены в виде реквизитов. Далее могут быть установлены функциональные зависимости реквизитов, которые используются для выделения нормализованных информационных объектов. Последующее определение структурных связей между объектами позволяет закончить построение информационно-логической модели (ИЛМ). Информационно-логическая модель должна быть представлена в каноническом виде, где между связанными нормализованными объектами отображены только иерархические отношения (типа 1:M) и объекты распределены по уровням иерархии.
Определение логической структуры реляционной базы данных на основе канонической ИЛМ является в значительной степени формальным, так как отображается в структуру реляционной БД адекватно. Информационные объекты отображаются в реляционные таблицы с соответствующей структурой. Логические связи объектов отображаются связями таблиц с помощью соответствующих ключей связи.
Определения и понятия илм
ИЛМ является моделью данных, отображающей предметную область (ПО) в виде совокупности информационных объектов
(ИО) и структурных связей между ними. ИЛМ может рассматриваться как логическая модель данных, подлежащих хранению в базе данных.
Для ИЛМ могут быть использованы как аналитический способ представления в виде матриц смежности, так и графический, дополняемый описанием объектов. Последний обладает наглядностью и наиболее удобен.
Структурные связи ИО – это бинарные связи между парами информационных объектов. Структурные связи характеризуются реальными отношениями и функциональными связями между ИО, отражающими потребности совместной обработки информационных объектов.
Каноническая ИЛМ. Реквизитный состав каждого информационного объекта канонической ИЛМ должен отвечать требованиям нормализации данных. Все связи информационных объектов в канонической ИЛМ для реализуемости в базе данных должны быть только одно-многозначные или одно-однозначные. Все объекты при графическом способе представления ИЛМ распределяются в соответствии с их подчиненность по уровням. Индекс уровня определяется числом связей в наиболее длинном пути от объектов нулевого уровня к данному объекту.
Информационные объекты
Информационный объект (ИО) – это информационное отображение некоторой сущности (реального объекта, явления, процесса или события), о которой должна быть представлена информация в БД. Совокупность ИО и их связей образуют ИЛМ ПО. Каждый ИО в ИЛМ должен иметь уникальное имя. Например: ГРУППА, ПРЕДМЕТ, ПРЕПОДАВАТЕЛЬ, КАФЕДРА или символическое имя: TOV, SKLAD, POST, и т.п.
Информационный объект определяется рядом качественных и количественных характеристик, которые представлены соответствующими реквизитами-признаками и реквизитами-основаниями, то есть он является совокупностью логически взаимосвязанных реквизитов.
Примерами информационных объектов могут быть совокупности реквизитов, отражающих характеристики товаров, материалов, подразделений, поставщиков, заказчиков, технологических операций, поставок и т.п. сущностей.
Структура ИО. Состав реквизитов ИО определяет его структуру. Совокупность реквизитов ИО канонической ИЛМ должна отвечать требованиям нормализации
Нормализованный информационный объект имеет “линейную” структуру данных, т.е. в нем отсутствуют группы, множественные элементы и т.п. структуры данных, что допускают сетевые и иерархические модели. Нормализация обеспечивает простое отображение ИО в реляционную таблицу.
Для получения нормализованных объектов определяются функциональные зависимости реквизитов в процессе информационного семантического анализа.
Реквизиты ИО. Реквизиты ИО подразделяются на ключевые и описательные, которые являются функционально зависимыми от ключевых.
Функциональная полная зависимость реквизитов имеет место только в том случае, если одному значению ключа соответствует только одно значение зависимого (описательного) реквизита.
Функциональные зависимости реквизитов не надо путать с арифметическими зависимостями (например, стоимость не рассматривается как функционально-зависимая от количества, или от цены).
Экземпляры ИО и их идентификация. Информационный объект имеет множество реализаций – экземпляров ИО. Экземпляр ИО представлен совокупностью конкретных значений реквизитов, т.е. сведений об одном экземпляре объекта. Каждый экземпляр ИО должен однозначно определяться (идентифицироваться) значением уникального ключа, то есть такого ключа, значение которого не может повторяться.
Например, для объекта ТОВАР ключом является код товара, для объекта ПОСТАВКА ключом является код товара+код поставщика+дата.