Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по ТЭИС.doc
Скачиваний:
40
Добавлен:
05.11.2018
Размер:
1.23 Mб
Скачать

2. Введение в моделирование информации

2.1 Классификация моделей данных

Проектирование сложных систем основано на принципе "разделяй и властвуй": сложная задача делится на несколько более простых; они, в свою очередь, могут быть разделены на еще более простые и т.д. до тех пор, пока каждая отдельная задача не станет обозримой и поддающейся решению. Составные части сложной задачи образуют иерархическую структуру, на каждом уровне которой описание задачи содержит новые детали. В соответствии с указанным принципом процесс разработки ЭИС можно рассматривать как процесс все более точного описания системы: сначала выясняются требования к системе со стороны пользователей, затем эти требования описываются с помощью формальных и неформальных языков и моделей и, наконец, подбирается техническое и системное программное обеспечение, в среде которого создаются прикладные программы и базы данных. В этом процессе важно сохранить правильное и непротиворечивое (целостное) представление системы при переходе от одного вида описания к другому.

Представим себе информационную систему в виде фабрики, в которой сырьем, продуктом и инструментом обработки является информация. Информация имеет двоякую природу: фактуальные знания (осмысленные данные) и операционные знания (правила обработки информации, основанные на общих зависимостях между фактами). Например, сведения о том, что Цена товара = 20 руб., а Количество товара = 300 кг., относятся к фактуальному знанию; в то время как формула расчета “Стоимость товара = Цена * Количество “ - это операционное знание. Сырьем и продуктом нашей “фабрики” являются фактуальные знания, а инструменты и “станки” представляют собой операционные знания, которые обычно реализуются в виде программ.

При разработке ИС требуется описать оба вида знаний об информации. Для этого на разных этапах разработки ИС применяют различные информационные модели, которые представляют собой формальные или полуформальные способы для описания знаний об информации. На рис.2.1 показана классификация информационных моделей.

Рис. 2.1

На начальном этапе создания ИС выявляют самые общие закономерности строения, изменения и обработки экономической информации в конкретной предметной области. Совокупность этих знаний называют концептуальной моделью (информационно-логической, инфологической моделью) предметной области. Данная модель является самой общей моделью разрабатываемой

информационной системы; она не зависит от программно-аппаратной платформы ИС и предназначена для конечных пользователей и системных аналитиков. Обычно концептуальную модель представляют в виде трех компонентов: объектного, функционального и поведенческого.

Объектная модель - это описание структуры предметной области в виде совокупности взаимосвязанных объектов (состав объектов, их свойства и связи). Элементарной единицей структурного знания является факт, описывающий одно свойство или одну связь, который представляется в виде триплета:

предикат ( Объект, Значение ),

например: профессия (Иванов, экономист) - описание свойства объекта “Иванов”; работает (Иванов, Бухгалтерия) - описание связи между объектами “Иванов” и “Бухгалтерия”.

К типовым связям относят связи “род - вид”, “целое - часть”, “причина - следствие”, “цель -

средство”, “функция - аргумент”, “ассоциация”, “хронология”, “пространственное положение” и

др. Для описания объектной модели применяют диаграммы потоков данных (Data Flow Diagrams, DFD), диаграммы структур данных (Data Structure Diagram, DSD) и диаграммы "сущность - связь" (Entity - Relationship Diagrams, ERD).

Функциональная модель описывает действия над объектами и методы их преобразования. В качестве единицы этого вида информации определяют функциональную зависимость фактов:

факт В имеет место только тогда, если имеет место конъюнкция фактов А1, А2, ...Аn:

A1 ^ A2 ^ ... ^ An => B.

Функциональная зависимость между фактами возникает как отражение причинно-следственных, логических и арифметических зависимостей между реальными объектами.

Функциональная модель строится путем последовательной декомпозиции целей ИС и представляется графически в виде дерева целей. Кроме того, для описания функций ИС применяют функциональные диаграммы (Structured Analysis and Design Technique, SADT).

Поведенческая модель отражает изменение состояния объектов в результате некоторых событий. Состояние объекта в какой - либо момент времени описывается набором значений его свойств. Поведение объекта описывается в виде набора действий, связанных с событиями в предметной области. Для описания поведения ИС применяют событийные графы и матрицы, иаграммы потоков событий.

На следующем этапе создания ЭИС (проектирование реализации ИС) выбирается формальный метод представления знаний и в его рамках проектируется логическая структура информационного обеспечения ИС.

В интеллектуальных информационных системах применяют различные модели знаний, которые

отличаются характером представления объектного, функционального и поведенческого видов знаний. Моделью знаний называют совокупность средств структурирования и обработки единиц знаний. В настоящее время известны следующие модели знаний:

  • логическая модель описывает объекты и операции над ними в виде предикатов первого порядка, является строго формальной, применяет метод логического вывода новых знаний “от цели к данным”;

  • продукционная модель описывает знания в виде набора фактов и правил вида “если - то”, позволяет учитывать неопределенность знаний, использует эвристические правила вывода;

  • семантическая сеть описывает знания в виде бинарных типизированных отношений между объектами и наглядно изображается в виде графа (вершина - объект, дуга - связь между двумя объектами);

  • фреймовая модель - это семантическая сеть с N-арными отношениями между объектами и присоединенными процедурами, которые реализуют операционные знания;

  • объектно-ориентированная модель является дальнейшим развитием фреймовой модели,

она предусматривает инкапсуляцию процедур в структуру объектов и распространяет наследование свойств на эти процедуры (полиморфизм процедур).

В обычных ИС операционные и поведенческие знания реализуются в виде программ, а объектные знания - в виде базы данных. Для описания структуры БД применяют ту или иную модель данных - совокупность правил структурирования данных, правил выполнения операций над ними, а также ограничений целостности БД, которые описывают допустимые связи и значения данных, допустимые последовательности их изменения.

Выделяют несколько типов формальных моделей данных. В настоящее время наиболее широко

применяют реляционную модель данных, основанную на теории отношений. Кроме того, исторически сложились и применяются “дореляционные модели”: сетевая, иерархическая, инвертированные списки и др.; разрабатываются и новые модели: постреляционные, многомерные, объектно-реляционные и др.

Для описания логики работы программ, их структуры, их взаимодействия с данными и друг с другом применяют схемы программ, схемы структуры программ, схемы данных, схемы взаимодействия программ. Правила изображения этих схем описаны государственными стандартами ЕСПД [ ГОСТ 19.701-90. Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила выполнения].

На этапе физического проектирования логическая структура базы данных или базы знаний отображается на физических носителях информации, а также производится разработка и отладка программ. На этом этапе используются модели представления информации на физическом уровне: физические и логические записи, файлы, указатели, индексы и т.п. В настоящее время инструментальные средства разработки ИС позволяют практически полностью автоматизировать процесс физического проектирования структуры данных и во многом автоматизируют процесс разработки прикладных программ.