
Концептуальные средства описания
Традиционный подход к построению информационных систем долгое время сводился к определению данных с двух различных точек зрения – точки зрения пользователя и точки зрения компьютера. С точки зрения пользователя, которую мы будем называть внешней схемой, определение данных представляется в контексте отчетов и выборок, предназначенных для облегчения отдельным лицам выполнять конкретные обязанности. В этом случае структура данных изменяется в зависимости от сферы бизнеса и особенностей конкретного пользователя. С точки зрения компьютера, которую мы будем называть внутренней схемой, данные определяются в терминах файловых структур для хранения и поиска. Структура данных при компьютерном хранении зависит от конкретной компьютерной технологии и от потребности в эффективной обработки данных.
Концепция двух схем привела к тому, что большинство крупных компаний вынуждено было для удовлетворения информационных потребностей разработать несколько баз данных, находящихся под управлением нескольких СУБД, что приводило к избыточности и противоречивости данных. Исследовательская группа по системам управления базами данных ANSI/X3/SPARC пришла к выводу, что для создания идеальной среды управления данными необходимо определение их с третьей точки зрения. Эта точка зрения называется концептуальной схемой и сводится к единому определению данных в рамках одного предприятия, не ориентированному на какое-либо конкретное использование их и не зависящему от того, как физически осуществляется хранение данных или доступ к ним.
Основная цель концептуальной схемы заключается в выработке непротиворечивой интерпретации и определении взаимосвязей данных для их объединения, совместного использования и управления целостностью данных.
Концептуальная схема должна обладать тремя важными свойствами:
Она должна быть согласована с инфраструктурой бизнеса и верной во всех сферах применения.
При ее расширении новые данные должны определяться без изменения ранее определенных.
Она должна удобно адаптироваться как к точкам зрения пользователей, так и к многообразию структур хранения данных и доступа к ним.
Необходимость определения данных с концептуальной точки зрения привела к разработке методологии моделирования данных , основанной на семантике, то есть к трактовке данных в контексте их взаимосвязей с другими данными.
Семантическая модель является абстрактной схемой. Рассмотрим основные понятия семантического моделирования.
Понятие типа взято из теории абстрактных типов данных. Тип данных – это определение объектов, их инвариантных свойств и операций, допустимых над ними. Тип данных есть результат классификационного обобщения к конкретной совокупности значений данных. Все языки высокого уровня в качестве основных структур данных рассматривают различные типы данных.
Понятие типа не следует путать с понятием множества, поскольку множество – любое объединение в одно целое определенных вполне различимых объектов из нашего восприятия или мысли, которые называются элементами множества. То есть между элементом множества и самим множеством существует отношение “часть-целое”. Тип является абстракцией реальных объектов, то есть тип и объект данного типа находятся в отношении “абстрактное-конкретное”. Например, типы данных integer, real, file.
Каждый тип имеет уникальное имя. Например, при описании учебного процесса могут быть введены следующие типы: ПРЕДМЕТ, ПРЕПОДАВАТЕЛЬ, СТУДЕНТ. Считается, что в каждом состоянии предметной области каждый объект имеет один или несколько типов. Например, в университете каждый обучающийся имеет хотя бы два типа: СТУДЕНТ (с точки зрения деканата) и ПАЦИЕНТ (с точки зрения студенческой поликлиники).
М
ножество
типов данной предметной области,
снабженное некоторой структурой,
зависящей от связей между типами,
называется концептуальной моделью или
схемой предметной области.
На множестве типов определены отношения и операции.
Отношение IS-A. Если в любой момент времени каждый объект некоторого типа T1 является объектом типа T2, то T1 IS-A T2. Например
В этом примере имеют место следующие отношения: Преподаватель IS-A Сотрудник, Сотрудник IS-A Человек.
В предметной области одни объекты считаются более сложными, другие – более простыми Например, тип СТУДЕНТ является частью ГРУППЫ, ГРУППА, в свою очередь является частью КУРСА. Для того, чтобы раскрыть структуру объекта, смоделировать отношение принадлежности вводится отношение INSTANCE-OF. Это отношение интерпретируется следующим образом: если T INSTANCE-OF T1,T2,...Tn, то объект типа T может состоять из объектов типа T1,T2,...Tn.
Еще одно специальное отношение COMPONENT-OF вводится для композиционных объектов, которые являются конечными последовательностями других объектов. Например, дата, состоящая из числа, месяца и года.
С помощью известных операций над множествами можно конструировать новые типы.
Множество типов, отношения и операции определяют структуру ПО, однако не все операции над данными предметной области сохраняют структуру. Для сохранения структуры вводят так называемые ограничения целостности. Например, один и тот же студент не может быть включен в разные группы.
Совокупность явно сформулированных ограничений целостности вместе с множеством типов и отношениями IS-A, INSTANCE-OF, COMPONENT-OF называют концептуальной схемой предметной области.