
- •1 Лекция введение
- •Глава 1 основные понятия экономических информационных систем
- •1.1 Информационная система в общем виде
- •Понятие информации
- •Понятие системы
- •Классификация эис
- •2 Лекция
- •1.2 Компоненты экономических информационных систем
- •Предметная область
- •Детализация эис
- •3 Лекция
- •1.3 Классификация и основные свойства единиц информации
- •Классификация и кодирование
- •4 Лекция
- •1.4 Жизненный цикл экономической информационной системы
- •5 Лекция
- •Глава 2 . Модели данных
- •2.1 Реляционная модель данных
- •2.2 Нормализация отношений
- •2.2.1 Функциональные зависимости и ключи
- •2.2.2 Вторая и третья нормальные формы отношений
- •Алгоритм нормализации (к знф)
- •2.2.3 Ациклические базы данных
- •Алгоритм проверки структуры бд на ацикличность
- •2.2.4 Доступ к реляционной базе данных
- •6 Лекция
- •2.3 (6.1) Сетевая и иерархическая модели данных
- •Организация веерного отношения в памяти эвм
- •Алгоритм получения двухуровневой структуры сети
- •Иерархическая модель данных
- •Алгоритм получения структуры иерархической бд
- •Сравнение моделей данных
- •2.4 (6.2) Модель инвертированных файлов и информационно—поисковые системы
- •7 Лекция (Глава 3). Методы организации данных
- •7.1 (3.1) Анализ алгоритмов и структур данных
- •Критерии эффективности алгоритмов
- •Поиск в последовательном массиве
- •Корректировка последовательного массива
- •Цепная (списковая) организация данных
- •Цепной каталог
- •Алгоритм вставки записи с ключом f в цепной каталог.
- •Древовидная организация данных
- •Алгоритм построения упорядоченного бинарного дерева
- •7.2 (3.2) Методы ускорения доступа к данным
- •Адресная функция
- •Индексы
- •7.3 (3.3) Организация данных во внешней памяти эвм
- •Оптимальное вторичное индексирование
- •8 Лекция (Глава 4). Моделирование предметных областей в экономике
- •8.1 (4.1) Семантические модели данных
- •Модель семантических сетей
- •8.2 (4.2) Базы знаний
- •Продукционная модель знаний
- •Семантические сети для представления знаний
- •8.3 (4.3) Тезаурусы экономической информации
- •9 Лекция (Глава 5). Моделирование вычислительных процессов в экономических информационных системах
- •9.1 (5.1) Параметризация экономических информационных систем
- •9.2 (5.2) Формализация процессов
- •Сети Петри
- •9.3 (5.3) Моделирование вычислительной системы
Алгоритм нормализации (к знф)
1. Получить исходное множество функциональных зависимостей для атрибутов рассматриваемой БД.
Если исходные функциональные зависимости не удается определить путем анализа смысловых характеристик атрибутов, приходится использовать перечисление и отбраковку допустимых вариантов функциональных зависимостей.
Рассматриваются все сочетания по два атрибута, и в каждом случае доказывается или отвергается функциональная зависимость. Затем рассматриваются сочетания:
• по три атрибута, где первые два могут функционально определять третий,
• по четыре атрибута, где первые три могут функционально определять четвертый и т.д.
Применение теорем о функциональных зависимостях позволяет сократить количество рассматриваемых вариантов. Практически перечисление вариантов заканчивается, когда сочетания атрибутов станут содержать первичный ключ.
2. Получить минимальное покрытие множества функциональных зависимостей. В минимальном покрытии должны отсутствовать зависимости, которые являются следствием оставшихся зависимостей по теоремам 1 — 6. В частности, требуется объединить функциональные зависимости с одинаковой левой частью в одну зависимость. Обозначим полученное минимальное покрытие функциональных зависимостей через
F = {f1,…f1,…fk}
Определить первичный ключ отношения.
3. Для каждой функциональной зависимости fi создать проекцию исходного отношения Ri = R[Xi], где Xi — объединение атрибутов из левой и правой частей fi.
4. Если первичный ключ исходного отношения не вошел полностью ни в одну проекцию, то создать отдельное отношение из атрибутов ключа.
Для практического применения алгоритма нормализации до ЗНФ существенны два вопроса:
• как учесть наличие взаимнооднозначных соответствий,
• как сократить объем перебора вариантов при первоначальном определении множества функциональных зависимостей.
Для взаимнооднозначных соответствий принято выделение старшего (по объему представляемого понятия) атрибута, который затем представляет все атрибуты взаимнооднозначного соответствия.
Для ускорения шага 1 алгоритма нормализации не рассматриваются такие зависимости, которые являются следствием уже найденных зависимостей и теорем 1 — 6, и используется ряд закономерностей об отсутствии функциональных зависимостей. Среди них — теорема:
Если А —>В и D—V—> С, то ABD—/—> С и правило, согласно которому функциональные зависимости с атрибутом—основанием в левой части не требуется рассматривать (в противном случае алгоритм станет создавать отношения, состоящие только из атрибутов—оснований и не имеющие экономического смысла).
Прямер
Рассмотрим отношение со сведениями о научно—исследовательских работах. Список атрибутов: НИИ, Директор, Адрес, Отдел, Ксотр, Тема, Датанач, Датакон, Приор, Заказ, Обфин, Работа, Прод ФИО.
На шаге 1 будет выделен блок взаимно—однозначных соответствий на атрибутах: НИИ, Директор, Адрес. Далее атрибутом—представителем'будем считать НИИ. Список функциональных зависимостей приводится ниже.
Список функциональных зависимостей
Отдел—>НИИ,
Отдел —> Директор,
Отдел —> Ксотр,
Тема —> Датанач,
Тема —> Датакон,
Тема —> Приор,
ФИО —> НИИ,
ФИО —> Директор,
ФИО —> Отдел,
Тема, Заказ —> Обфин,
Тема, Работа, ФИО —> Прод.
Структура реляционной базы данных
R1 (НИИ,Директор,Адрес),
R2 (НИИ,Отдел,Ксотр),
R3 (Тема,Датанач,Датакон,Приор),
R4 (ФИО,Отдел),
R5 (Teмa,Зaкaз,Oбфин),
R6 (Тема ,Работа,ФИО,Прод),
R7 (Тема,Заказ,Работа,ФИО)
Отношение R7 содержит первичный ключ для исходного множества атрибутов, а отношения R1—R6 построены на основе зависимостей из минимального покрытия.
Вычислительная сложность каждого этапа приведения отношений к ЗНФ различна, но наиболее длительным является получение исходного списка функциональных зависимостей. Количество проверяемых ФЗ является экспоненциальной функцией от количества рассматриваемых атрибутов.
Хотя на основе функциональных зависимостей можно установить более сильную нормальную форму Бойса—Кодда (БКНФ), практически она применяется редко. Во—первых, база данных в БКНФ не всегда существует, во—вторых, ее отличие от ЗНФ обычно связано с наличием нескольких ключей в отношении, что в экономических приложениях встречается исключительно редко.