Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции. Все темы! / Л11_ Информационный анализ предметной области.doc
Скачиваний:
200
Добавлен:
16.12.2013
Размер:
172.54 Кб
Скачать

173

Лекция 11. Разработка базы данных. Информационный анализ предметной области и определение логической структуры БД

Лекция 11. Разработка базы данных. Информационный анализ предметной области и определение логической структуры БД

Информационный анализ предметной области

Разработка базы данных производится на основе обследования предметной области (ПО) и является результатом информационного анализа и построения модели данных предметной области. Завершается разработка определением логической структуры БД.

На основе обследования составляется описание ПО и документов, которое должно охватывать весь спектр реальных объектов, процессов и явлений, т.е. сущностей, данные о которых должны быть размещены в БД. Обследование начинается с определения состава данных ПО, подлежащих хранению в базе для обеспечения задач и запросов пользователей. Основным источником данных являются справочные, плановые и оперативно-учетные документы. Таким образом, определению структуры базы данных предшествует выявление информационных потребностей.

Далее необходимо осуществить информационный анализс цельюформализацииданных, необходимой для их организации и обработки во внутримашинной сфере. При этом должен быть произведенсемантический анализданных и выявленылогические взаимосвязи. В результате данные должны быть структурированы. Удобным способом представления структурированных данных являетсяинформационно-логическая модель данных предметной области(ИЛМ ПО). Такая модель является основой для определения логической структуры БД в соответствии с типом модели данных, поддерживаемой СУБД.

Для получения проекта структуры реляционной БД в процессе построения ИЛМ должна быть произведена нормализацияданных предметной области, которая позволит получить каноническую форму ИЛМ. Разработка ИЛМ ПО базируется на описании данных и документов предметной области, полученном в результате ее обследования. В процессе информационного анализа для построения канонической ИЛМ необходимо определить структуру и связинормализованных информационных объектов. На основе канонической ИЛМ, легко получитьлогическую структуру реляционной БД. Такая БД будет отвечать требованиям, отсутствия избыточности (дублирования описательных данных), однократного ввода и в ней может поддерживатьсяцелостность(непротиворечивость) данных.

В результате проектирования должна быть определена структура реляционной базы, т.е.состав реляционных таблиц, их структура и логические связи таблиц.Структура реляционной таблицы определяетсясоставом столбцов (полей), их последовательностью, типом и длиной (размером) данных каждого столбца, а такжеключом таблицы (уникальный идентификатор записей).

Варианты подходов к проектированию БД.При проектировании базы данных могут использоваться два подхода. Припервом подходесначала устанавливаются основные задачи, для решения которых строится база, и потребности задач в данных. Строго в соответствии с потребностями выявляются информационные объекты, из которых должна состоять БД. Привтором подходеизучается предметная область, производится анализ её данных, и устанавливаютсятиповые объектыпредметной области. Возможно сочетание обоих подходов.

При разработке ИЛМ в соответствии с первым подходом сначала осуществляется выявление форм документов – источников, содержащих необходимых данные. Данные в документах представлены в виде реквизитов. Далее могут быть установленыфункциональные зависимости реквизитов, которые используются для выделения нормализованных информационных объектов. Последующееопределение структурных связей между объектамипозволяет закончить построение информационно-логической модели (ИЛМ). Информационно-логическая модель должна быть представлена вканоническомвиде, где между связанными нормализованными объектами отображены только иерархические отношения (типа 1:M) и объекты распределены по уровням иерархии.

Определение логической структуры реляционной базы данных на основеканонической ИЛМ является в значительной степени формальным, так как отображается в структуру реляционной БД адекватно. Информационные объекты отображаются в реляционные таблицы с соответствующей структурой. Логические связи объектов отображаются связями таблиц с помощью соответствующих ключей связи.

Определения и понятия илм

ИЛМ является моделью данных, отображающей предметную область (ПО) в виде совокупностиинформационных объектов (ИО)иструктурных связей между ними. ИЛМ может рассматриваться как логическая модель данных, подлежащих хранению в базе данных.

Для ИЛМ могут быть использованы как аналитический способ представления в виде матриц смежности, так и графический, дополняемый описанием объектов. Последний обладает наглядностью и наиболее удобен.

Структурные связи ИО– это бинарные связи между парами информационных объектов. Структурные связи характеризуютсяреальными отношениямимежду экземплярами разных информационных объектови функциональными связямимежду ИО, отражающими потребности совместной обработки информационных объектов.

Каноническая ИЛМ.Реквизитный состав каждого информационного объекта канонической ИЛМ должен отвечатьтребованиям нормализации данных. Все связи информационных объектов в канонической ИЛМ для реализуемости в базе данных должны быть толькоодно-многозначные или одно-однозначные. Все объекты при графическом способе представления ИЛМ распределяются в соответствии с их подчиненность по уровням. Индекс уровня определяется числом связей в наиболее длинном пути от объектов нулевого уровня к данному объекту.

Информационные объекты

Информационный объект (ИО) – это информационное отображение некоторойсущности(реального объекта, явления, процесса или события), о которой должна быть представлена информация в БД. Совокупность ИО и их связей образуют ИЛМ ПО. Каждый ИО в ИЛМ должен иметь уникальное имя. Например: ГРУППА, ПРЕДМЕТ, ПРЕПОДАВАТЕЛЬ, КАФЕДРА, или символическое имя: TOV, SKLAD, POST, и т.п.

Информационный объект определяется рядом качественных и количественных характеристик, которые представлены соответствующими реквизитами-признакамииреквизитами-основаниями, то есть он является совокупностью логически взаимосвязанных реквизитов.

Примерами информационных объектов могут быть совокупности реквизитов, отражающих характеристики товаров, материалов, подразделений, поставщиков, заказчиков, технологических операций, поставок и т.п. сущностей.

Структура ИО. Состав реквизитов ИО определяет его структуру. Совокупность реквизитов ИО канонической ИЛМ должна отвечать требованиям нормализации

Нормализованный информационный объект имеет “линейную” структуру данных, т.е. в нем отсутствуют группы, множественные элементы и т.п. структуры данных, что допускают сетевые и иерархические модели. Нормализация обеспечивает простое отображение ИО в реляционную таблицу.

Для получения нормализованных объектов определяются функциональные зависимости реквизитовв процессе информационного семантического анализа.

Реквизиты ИО.Реквизиты ИО подразделяются наключевыеиописательные,которые являютсяфункционально зависимымиотключевых.

Функциональная полная зависимость реквизитов имеет место только в том случае, если одному значению ключа соответствует только одно значение зависимого (описательного) реквизита.

Функциональные зависимости реквизитов не надо путать с арифметическими зависимостями (например, стоимость не рассматривается как функционально-зависимая от количества, или от цены).

Экземпляры ИОи их идентификация. Информационный объект имеет множество реализаций –экземпляровИО. Экземпляр ИО представлен совокупностью конкретных значений реквизитов, т.е. сведений об одном экземпляре объекта. Каждый экземпляр ИО должен однозначно определяться (идентифицироваться) значениемуникальногоключа, то есть такого ключа, значения которого не могут повторяться.

Например, для объекта ТОВАР ключом является код товара, для объекта ПОСТАВКА ключом является код товара+код поставщика+дата.