
Вопрос8.
В фактографических информационных системах регистрируются факты – конкретные значения данных (атрибутов) об объектах (сущностях) реального мира. Такие системы способны давать однозначные ответы на поставленные вопросы (информация в них структурирована). Центральное функциональное звено фактографических информационных систем – системы управления базами данных (СУБД). Фактографические системы используются не только для реализации справочных функций, но и для решения задач обработки данных. Под обработкой данных понимается специальный класс решаемых на ЭВМ задач, связанных с вводом, хранением, сортировкой, отбором и группировкой записей данных однородной структуры. В большинстве случаев эти задачи предусматривают предоставление пользователям итоговых результатов обработки в виде отчетов табличной формы.
Модели данных.
Модель данных — это совокупность взаимосвязанных структур данных и операций над этими структурами. Вид модели и используемые в ней типы структур данных отражают концепцию организации и обработки данных, используемую в СУБД, поддерживающей модель, или в языке системы программирования, на котором создается прикладная программа обработки данных.
Файловая модель. На ранней стадии использования информационных систем в экономике применялась файловая модель данных. В файловых системах реализуется модель типа плоский файл. Плоский файл это файл, состоящий из записей одного типа и не содержащий указателей на другие записи, двумерный массив элементов данных.
Сетевые и иерархические модели. Более сложными моделями данных по сравнению с файловой являются сетевые и иерархические модели, которые поддерживаются в системе управления базами данных соответствующего типа. Тип модели данных, поддерживаемой СУБД на машинном носителе, является одним из важнейших признаков классификации СУБД. Сетевая или иерархическая модель данных представляет соответствующий метод логической организации базы данных в СУБД. Иерархическая модель представляет собой древовидную структуру с корневыми сегментами, имеющими физический указатель на другие сегменты. Одно из неудобств этой модели заключается в том, что реальный мир не может быть представлен в виде древовидной структуры с единственным корневым сегментом. Иерархические БД обеспечивали указатели между различными деревьями баз данных, но обработка данных с использованием таких связей была не всегда удобной.
Реляционная модель данных. Характеристики реляционной модели заключены в следующем:
Модель описывает данные с их естественной структурой, не добавляя каких-либо дополнительных структур, необходимых для машинного представления или для целей реализации.
Модель обеспечивает математическую основу для интерпретации выводимости, избыточности и непротиворечивости отношений.
Модель обеспечивает независимость данных от их физического представления, от связей между данными и от соображений реализации, связанных с эффективностью и подобными проблемами.
В объектно-ориентированных базах данных (ООБД) важнейшее место отводится объектам, на основе которых могут определяться другие объекты благодаря использованию концепции, называемой наследованием. При этом некоторые или все атрибуты (либо свойства) определяющего объекта наследуются каким-то другим объектом, одни атрибуты и свойства добавляются, а другие могут удаляться.
Построение концептуальной модели
Наиболее распространен подход, основанный на анализе потребностей пользователей в информации. Считается, что потребности эти отражены в существующих документах и дополнительно могут быть выявлены в результате специального опроса пользователей.
Такой подход назовем ИНТЕГРАЦИОННЫМ, т.к. концептуальная модель строится в результате интеграции анализируемых потребностей.
Кстати, используемые нами отношения, исходные для нормализации, как раз отражают конкретные информационные потребности.
Основным недостатком такого (интеграционного) подхода является необходимость постоянного развития и модернизации модели, связанной с естественным расширением информационных потребностей пользователей с течением времени.
Второй подход базируется на системном анализе предметной области, чаще всего посредством последовательного, многоуровневого разбиения ее на подсистемы до тех пор, пока не станет очевидным информационное поле составных частей. С учетом этой специфики назовем такой подход ДЕКОМПОЗИЦИОННЫМ и отметим сложность его реализации (необходимо активное участие руководителей различных уровней) и потребность в серьезном теоретическом обосновании.
Одним из наиболее распространенных подходов к разработке КИМПО является подход, предложенный одним из руководителей корпорации ORACLE Ричардом Баркером.
Подход основывается на системном анализе предметной области, реализуемым преимущественно посредством интервьюирования специалистов предметной области и направлен на построение ER-модели (Ehtety-Relantion).
Общим недостатком рассматриваемого подхода является низкий уровень формализма в анализе предметной области, что делает процесс создания ее концептуальной информационной модели по существу искусством.
Модель сущность-связь (ER-модель) (англ. entity-relationship model, ERM) — модель данных, позволяющая описывать концептуальные схемы предметной области.
ER-модель используется при высокоуровневом (концептуальном) проектировании баз данных. С её помощью можно выделить ключевые сущности и обозначить связи, которые могут устанавливаться между этими сущностями.
Во время проектирования баз данных происходит преобразование ER-модели в конкретную схему базы данных на основе выбранной модели данных (реляционной, объектной, сетевой или др.).
ER-модель представляет собой формальную конструкцию, которая сама по себе не предписывает никаких графических средств её визуализации. В качестве стандартной графической нотации, с помощью которой можно визуализировать ER-модель, была предложена диаграмма сущность-связь (ER-диаграмма) (англ. entity-relationship diagram, ERD).
Понятия ER-модель и ER-диаграмма часто ошибочно не различают, хотя для визуализации ER-моделей предложены и другие графические нотации
Предметная область.
Только философы имеют дело с реальным миром. При решении же конкретных проблем обычно ограничиваются той его частью, которая является областью данной деятельности. В этих случаях интерес представляют лишь некоторые его объекты. Совокупность таких объектов называется предметной областью, а сами объекты - объектами предметной области. Объектами могут быть:
люди, например, перечисленные в какой либо платежной ведомости;
предметы, например детали, которые производятся;
построения – воображаемые объекты, например счета, в задаче получения счетов.
Очевидно, что одновременно могут существовать несколько предметных областей, соответствующих разным проблемам.
Технология анализа предметной области.
Первым этапом проектирования БД является анализ предметной области, который заканчивается построением концептуальной схемы. Анализ предметной области не зависит от программной и технической сред, в которых реализуется БД. Анализ предметной области целесообразно разбить на три этапа:
анализ концептуальных требований и информационных потребностей;
выявление информационных объектов или сущностей и связей между ними;
построение концептуальной модели предметной области и проектирование концептуальной схемы базы данных.
Анализ концептуальных требований и информационных потребностей Требование пользователей к разрабатываемой информационной системе представляет собой обычно список вопросов, указаний и действий. Эти сведения разработчик ИС получает в процессе диалога с ее будущим пользователем, здесь же выясняются требования к вводу, корректировке и обновлению информации. Требования пользователей уточняются и дополняются при анализе имеющихся и перспективных задач. Далее проектировщик выбирает по имеющимся документам необходимые информационные объекты.
Выявление информационных объектов и связей между ними Выберем информационные объекты характеризующую предметную область Успеваемость в институте. Для каждого объекта выявим связи между ними, определим ограничения, накладываемые на информационный объект.
Построение концептуальной модели предметной области Заключительная фаза анализа предметной области состоит в проектировании ее информационной структуры или концептуальной модели. Концептуальная модель включает описания объектов и их взаимосвязей, представляющих интерес в рассматриваемой предметной области (ПО) и выявляемых в результате анализа данных.