Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка информатика.doc
Скачиваний:
3
Добавлен:
01.05.2019
Размер:
1.24 Mб
Скачать

7.4.1.4. Информационно-логическая модель предметной области

Одним из способов логического проектирования базы данных является построение информационно-логической модели предмет­ной области (ИЛМ ПО). ИЛМ обеспечивает интегрированное, не за­висящее от средств реализации представление данных предметной области и состоит из информационных объектов и структурных связей объектов.

Информационные объекты (ИО) являются описанием сущностей (процессов, событий, предметов и т.п.) и представляют собой логически связанные реквизиты.

Сущность - это реальный объект, процесс, явление или со­бытие, информация о котором должна быть представлена в БД. Сущность - понятие семантическое. Это то, что является источни­ком информации, например, цех, поставка товара, сотрудник, доку­мент или его часть и т.д. На основе ИО проектируются реляцион­ные таблицы. В теории реляционные таблицы называются отно­шениями.

Структура ИО соответствует, по крайней мере, третьей нор­мальной форме реляционной модели данных (ЗНФ). Структурные связи ИО отражают взаимосвязи ИО, определяются на уровне эк­земпляров объектов.

В процессе информационного анализа производится изучение входной информации задачи, сформулированной в индивидуаль­ном задании курсовой работы.

Главной задачей информационного анализа является пред­ставление информации, содержащейся во входных документах, в виде множества взаимосвязанных реляционных таблиц.

Входная информация задачи разделяется на условно-постоянную и оперативную информацию. Она отображается в ви­де реквизитов в документах, используемых в процессе функцио­нирования объекта предметной области. Перечень необходимых документов, используемых при выполнении курсовой работы, и их описание приведены в каждом индивидуальном задании.

Информационный анализ начинается с определения функ­циональных зависимостей, т.е. связи (отношения, по-английски relation) реквизитов входных документов между собой. В результате этого анализа выявляются информационные объекты. Функцио­нальные зависимости (ФЗ) определяются на основе семантического (смыслового) анализа предметной области. В курсовой работе ин­формация о предметной области представляется в виде докумен­тов, циркулирующих в ней, и ограничений ПО. В результате анали­за ПО должен быть выявлен состав форм документов и их реквизи­тов, подлежащих хранению в базе данных. Для минимизации воз­можных ошибок целесообразно семантический анализ производить по каждой из форм документов в отдельности. Это связано с тем, что форма документа уже отображает структуру данных, т.к. любой документ содержит логически связанные реквизиты. Как правило, в качестве аргументов ФЗ выступают ключевые реквизиты.

Ключом в документе является подмножество, состоящее из одного или нескольких реквизитов документа, предназначенное для однозначной идентификации документа в целом или группы рекви­зитов в нем. Ключ документа в целом позволяет выделить документ из множества других документов, а ключ строки документа - строку из множества строк в его табличной части. Очевидно, что ключе­вым называется реквизит, входящий в состав ключа. Ключ, состоя­щий из одного реквизита, называется простым, а из нескольких - составным. В ряде случаев ключом может быть несколько под­множеств ключевых реквизитов документа. Такие подмножества называются возможными, потенциальными или альтернативны­ми. Ключ, выбранный из множества альтернативных в качестве ключа ИО, называется выделенным ключом. Совокупность всех ИО одного типа в конкретной ПО образует множество ИО, элементы которого называются экземплярами ИО.

При выборе выделенного ключа из альтернативных следует руководствоваться:

  • ограничениями ПО;

  • минимизацией объема внешней памяти, занимаемой ба­зой данных;

  • использованием ключа в СУБД при решении задач поль­зователей.

Для выявления ИО необходимо во входных документах вы­явить первичные ключи. Роль первичных ключей играют реквизиты, однозначно определяющие другие реквизиты документа. Зависи­мые реквизиты часто называют описательными реквизитами.

В качестве ключевых реквизитов можно использовать код то­вара, номер документа, номер цеха, номер склада, ИНН покупате­ля, номер месяца и т.п. Все эти реквизиты являются, по существу, кодами (кодовыми обозначениями) объектов. Применение кодов имеет следующие достоинства:

  • коды обеспечивают уникальную (однозначную) идентифи­кацию объектов;

  • размер кода в символах, как правило, меньше наименова­ния объекта;

  • названия объектов могут меняться, а коды практически постоянны;

  • применение классификационного метода кодирования по­зволяет выделять (группировать) подмножества объектов,

  • обладающих одинаковыми признаками, или упорядочивать объекты в соответствии со значениями признаков.

Если в документах коды отсутствуют, то в силу указанных вы­ше причин следует их добавить в информационные объекты, что позволит использовать коды в качестве первичных ключей для формирования информационных объектов на основе этих докумен­тов.

Задача проектировщика на этапе информационного анализа - спроектировать такое множество ИО, которое позволило бы получить множество взаимосвязанных реляционных таблиц, обладающее минимальной избыточностью хранимых в БД данных. Такое множество можно получить, используя нормали­зованные таблицы.

Связь между реляционными таблицами производится при по­мощи общих реквизитов, имеющихся в связываемых таблицах. Та­кие реквизиты в реляционных СУБД называются внешними ключа­ми.

Реляционная таблица может находиться в одной из шести нормальных форм: первой (1НФ), второй (2НФ), третьей (ЗНФ), в нормальной форме Бойса-Кодда (НФБК), четвертой (4НФ) и пятой (5НФ). Представление таблицы в одной из нормальных форм назы­вается нормализацией отношений. Нормализация отношений, по­мимо минимизации избыточности хранимых в БД данных, позволя­ет устранить аномалии (неправильности) данных при их измене­нии, удалении и добавлении.

Для загрузки данных в реляционную базу данных достаточно, чтобы они были представлены в 1-й нормальной форме (1НФ), к ко­торой предъявляются следующие требования.

  1. Все данные должны быть простыми, т.е. не множественны­ми. Это означает, что в одной ячейке таблицы может нахо­диться только одно значение.

  2. Все данные в таблице должны иметь один и тот же тип: чи­словой одного и того же формата, текстовый, дата и т.п.

Практически любой документ может быть представлен в виде реляционной таблицы в 1НФ. Однако в большинстве случаев такая таблица будет сильно избыточна (многократное повторение зна­чений одних и тех же данных). Это помимо проблем чисто техниче­ского характера (увеличение затрат внешней памяти и, как следст­вие, замедление обработки данных) приводит к так называемым аномалиям - трудностям ведения баз данных (изменение, удале­ние, добавление). Поэтому таблицы нормализуют, т.е. приводят к более старшим формам, как правило, к ЗНФ. В некоторых (доста­точно редких) случаях возникает необходимость приводить табли­цы к старшим формам НФБК, 4НФ, 5НФ.

Пример

Представим данные документа "Договор" в виде реляционных таблиц в 1НФ и ЗНФ.

Договор №___

от "___"_____________ 2006 г.

Поставщик:________________ Покупатель_______________

(наименование (наименование

поставщика) покупателя)