
- •Оглавление
- •Введение
- •1 Особенности экономической информации
- •1.1 Экономическая информация. Информационное обеспечение экономики
- •1.2 Свойства экономической информации
- •1.3 Классификация экономической информации
- •1) По функциям управления
- •2) По месту возникновения
- •3) По стадиям образования
- •4) По способу отображения
- •5) По стабильности
- •1.4 Основные компоненты экономической информации
- •1.5 Экономическая информация и данные
- •1.6 Требования к данным и информации
- •1.7 Внешние входящие информационные потоки
- •1.8 Внутренние информационные потоки
- •1.9 Мониторинг внешней деловой среды
- •2 Основные понятия экономических информационных систем
- •2.1 Информационная система в общем виде
- •2.2 Принципы построения и функционирования эис
- •2.3 Критерии оценки эффективности эис
- •Повышение эффективности управления объектом:
- •Эффективное использование ресурсов эис:
- •2.4 Классификация эис
- •2.5 Компоненты экономических информационных систем
- •2.5.1 Предметная область информационной системы
- •2.5.2 Детализация представлений эис
- •2.6 Свойства экономических информационных систем
- •3 Экономическая информационная система как особая модель объекта экономики
- •3.1 Модель объекта экономики как отражение его специфики
- •3.2 Моделирование экономических информационных систем. Средства реализации моделей
- •3.3 Уровни отображения предметной области. Типы описания моделей эис
- •4 Роль и место информационных систем в управлении экономическими объектами
- •4.1 Основные направления использования информационных систем в экономике
- •4.2 Роль информационных систем в экономике
- •4.3 Единое информационное пространство
- •4.4 Место эис в системе управления экономическим объектом
- •4.5 Жизненный цикл эис
- •5 Классификация и основные свойства единиц информации
- •5.1 Информационное пространство
- •5.2 Основные единицы информации — атрибуты
- •5.3 Составные единицы информации. Операции над единицами информации
- •5.4 Экономические показатели
- •6 Методы организации данных
- •6.1 Анализ алгоритмов и структур данных в эис
- •6.2 Линейная организация данных
- •6.2.1 Последовательная организация данных
- •6.2.2 Линейная списковая организация данных
- •6.3 Нелинейная организация данных
- •6.3.1 Древовидная организация данных
- •6.3.2 Нелинейные списковые структуры данных
- •6.4 Методы ускоренного доступа к данным
- •6.4.1 Интерполяционный поиск записи в массиве
- •6.4.2 Адресные функции
- •6.4.3 Способы организации индексируемого массива
- •6.5 Обработка информации по нескольким ключевым признакам
- •7 Модели данных
- •7.1 Описательная модель предметной области
- •7.1.1 Этап инфологического проектирования
- •7.1.2 Этап датологического проектирования
- •7.2 Назначение и основные компоненты системы баз данных, их уровни представления
- •7.3 Концептуальные модели данных
- •7.3.1 Типы структур данных
- •7.3.2 Операции над данными
- •7.3.3 Ограничения целостности
- •7.4 Иерархическая модель данных
- •7.5 Сетевая модель данных
- •7.6 Реляционная модель данных
- •7.6.1 Основные понятия реляционной модели данных
- •7.6.2 Реляционная структура данных
- •7.6.3 Целостность реляционных данных
- •7.6.4 Основные операции над данными
- •7.6.5 Нормализация отношений в рмд
- •8 Моделирование предметных областей в экономике
- •8.1 Семантические модели данных
- •8.1.1 Модель сущностей и связей
- •8.1.2 Модель семантических сетей
- •8.2 Базы знаний
- •8.2.1 Понятие знания. Пять основных свойств знаний
- •8.2.2 Модели представления знаний
- •8.3 Параметризация эис
- •Заключение
- •Список рекомендованной литературы
7.6.4 Основные операции над данными
Система отношений и операций над ними образует реляционную алгебру. Рассмотрим операции, которые могут быть произведены над отношениями. Как правило, список операций содержит проекцию, выборку, объединение, пересечение, вычитание, соединение и т.д.
Проекцией называется операция, которая переносит в результирующее отношение те столбцы исходного отношения, которые указаны в условии операции.
Операция проекции позволяет получить «вертикальное подмножество» отношения (подмножество столбцов). Она применяется для того, чтобы исключить из обработки атрибуты отношений, значения которых не требуются при формировании ответов на запросы. Благодаря операции проекции уменьшается объем промежуточных данных и соответственно время вычисления результатов.
С помощью проекции можно получить отношения-сино-нимы из несовпадающих по структуре исходных отношений. Значения этих проекций, вообще говоря, не совпадают, поэтому выбор исходного отношения влияет на правильность результата.
Например, если требуется отношение Х1, содержащее сведения только о должностях (таблица 7.1), то оно получается в результате выполнения проекции X1 = W1[ФАМИЛИЯ, ДОЛЖНОСТЬ]. Столбцы результирующего отношения могут указываться в любом порядке. Для поиска данных по ключу отдельные атрибуты объявляются в качестве возможных ключей, один из которых назначается первичным.
Выборкой называется операция, которая переносит в результирующее отношение те строки из исходного отношения, которые удовлетворяют условию выборки. Условие выборки проверяется в каждой строке отношения и не может охватывать информацию из нескольких строк.
В качестве примера получим значение выборки:
X2 = W1[ДОЛЖНОСТЬ = «экономист»].
Операции объединения, пересечения и вычитания производятся над двумя исходными отношениями с одинаковой структурой. Обозначим исходные отношения R1 и R2, а результирующее — T. Объединение, пересечение и вычитание — бинарные операции, они выполняются над двумя отношениями — синонимами.
Объединение T = R1 R2 содержит строки, присутствующие либо в отношении R1, либо в R2.
Пересечение T = R1 R2 содержит строки, присутствующие в отношениях R1 и R2 одновременно.
Вычитание T = R1 \ R2 содержит те строки из R1, которые отсутствуют в R2.
Операция соединения отношений выполняется над двумя исходными отношениями и создает одно результирующее. Каждая строка первого исходного отношения сопоставляется по очереди со всеми строками второго отношения, и если для этой пары строк соблюдается условие соединения, то они сцепляются и образуют очередную строку в результирующем отношении.
7.6.5 Нормализация отношений в рмд
Одним из основополагающих принципов проектирования модели данных является ее нормализация — т.е. приведение модели данных к нормальной форме. Это позволяет устранить избыточность хранимой информации. Степень нормализации может быть различной. Результатом нормализации является легко поддерживаемая модель данных, не содержащая неопределенностей и повторения данных. Например, в Microsoft Access существует средство автоматической нормализации схемы данных — Мастер анализа таблиц.
Рациональные варианты группировки имен атрибутов в отношения должны учитывать следующие требования:
корректировка отношений не должна приводить к двусмысленности или потере информации;
перестройка набора отношений при введении новых типов данных должна быть минимальной.
Нормализация представляет собой один из наиболее изученных способов преобразования отношений, позволяющих улучшить характеристики СЕИ и базы данных по перечисленным критериям.
Наличие в отношении достаточно большого числа функциональных зависимостей обычно приводит к усложнению процессов корректировки. Например, исключение или замена одного значения атрибута, который функционально зависит от многих других атрибутов, требует исключения или замены большого количества строк отношения. Поэтому целесообразно все отношения трансформировать в отношения более простой структуры, у которых функциональные зависимости взаимосвязаны простейшим способом. Такой процесс преобразования отношений называется нормализацией, а отношения, для которых не допускаются те или иные функциональные зависимости, называются нормальными формами.
Нормальные формы нумеруются последовательно от 1 по возрастанию, и чем больше номер нормальной формы, тем больше ограничений на хранимые значения должно соблюдаться в соответствующем отношении. Применяемые ограничения ориентированы на сокращение избыточной информации в реляционной базе данных.
В настоящее время используются четыре нормальные формы и четыре этапа нормализации: приведение к первой (1НФ), второй (2НФ), третьей (ЗНФ) и четвертой (4НФ) нормальным формам [1]. Отношение считается нормализованным, если оно находится в одной из этих форм. На каждую из форм распространяется принцип вложенности по возрастанию номера формы: если отношение находится в форме с номером п (например, в 3НФ), то оно находится и в форме с номером п – 1 (т.е. в 2НФ). Обязательным условием для работы с РМД является нахождение всех отношений в 1НФ.
Отношение в первой нормальной форме — это обычное отношение с двухуровневой структурой. Первая нормальная форма отношения (сокращенно 1НФ) определяется условием — среди значений атрибутов не должно быть кортежей. Если предполагается для обработки извлекать только часть атрибута (например, из даты только год), то отношение, содержащее такой атрибут, не находится в 1НФ.
Отношение находится в 1НФ, если значения всех его атрибутов атомарны. Одним из способов приведения отношения к 1НФ является декомпозиция (разложение) его на два или более новых отношений, в совокупности эквивалентных исходному и отвечающих требованиям, предъявляемым к РМД.
Условия, определяющие 1НФ отношения, не содержат никаких ограничений на возможные варианты функциональных зависимостей. Поэтому создание и корректировка значений в отношении, находящемся в 1НФ, часто бывают затруднены.
Отношение R находится во второй нормальной форме (2НФ), если оно находится в 1НФ и каждый неосновной атрибут функционально полно зависит от каждого вероятного ключа. Если вероятный ключ одноатрибутный, то условия 2НФ соблюдаются автоматически. Отсюда, например, следует, что бинарное отношение всегда находится в 2НФ.
Вероятным ключом отношения называется такое множество атрибутов, что каждое сочетание их значений встречается только в одной строке отношения и никакое подмножество атрибутов этим свойством не обладает.
Вероятных ключей в отношении может быть несколько.
Рассмотрим в качестве примера отношение АВС (имена и значения атрибутов — условные):
АВС |
||||
ZEN |
RAM |
AST |
SPIM |
BIG |
1А |
31 |
dwa |
wii |
73 |
ЗВ |
21 |
bun |
cup |
40 |
3D |
30 |
mun |
lam |
58 |
4D |
31 |
sab |
wii |
40 |
7В |
30 |
sab |
irt |
38 |
Можно утверждать, что вероятным ключом отношения АВС является атрибут ZEN (значения в столбце ZEN не повторяются). Кроме того, еще один вероятный ключ представлен парой атрибутов RAM, AST.
Важность вероятных ключей при обработке данных определяется тем, что выборка по известному значению вероятного ключа дает в результате одну строку отношения либо ни одной.
На практике атрибуты вероятного ключа отношения связываются со свойствами тех объектов и событий, информация о которых хранится в отношении. Если в результате корректировки отношения изменились имена атрибутов, образующих ключ, то это свидетельствует о серьезном искажении информации. Следовательно, систематическая проверка свойств вероятного ключа позволяет следить за достоверностью информации в отношении.
Когда в отношении присутствует несколько вероятных ключей, одновременное слежение за ними очень затруднено и целесообразно выбрать один из них в качестве основного (первичного).
Первичным ключом отношения называется такой вероятный ключ, по значениям которого производится контроль достоверности информации в отношении.
Применительно к экономической информации в подавляющем большинстве случаев отношения, полученные из существующих экономических документов, содержат единственный вероятный ключ, который является и первичным ключом. Это объясняется тем, что содержимое экономических документов понимается всеми пользователями одинаково. Первичный ключ часто называется просто ключ.
Каждое значение первичного ключа встречается только в одной строке отношения. Значение любого атрибута в этой строке тоже единственное.
Если через К обозначить атрибуты первичного ключа в отношении R(A,B,C,...,J), то справедливы следующие функциональные зависимости К А, К В, К С, ..., К J. Набор атрибутов первичного ключа функционально определяет любой атрибут отношения. Обратное также верно: если найдена группа атрибутов, которая функционально определяет все атрибуты отношения по отдельности, и эту группу нельзя сократить, то найден первичный ключ отношения.
Аналогично выполняется преобразование отношений и в другие НФ. Преобразование таблиц в другие формы необходимо в том случае, если предполагается добавление либо удаление кортежей или атрибутов, в результате чего в таблицах могут возникать искажения информации.
Преимущества реляционной модели данных:
возможность использования точных математических методов манипулирования данными и, прежде всего, аппарата реляционной алгебры и исчисления отношений;
простота изменения данных и организации разграничения доступа к ним. В реляционной модели всего одна информационная конструкция, которая формализует табличное наглядное представление данных, привычное для пользователей-экономистов;
наличие теоретически обоснованных методов нормализации отношений и проверки ацикличности структуры позволяет получать базы данных с заданными характеристиками;
независимость данных проявляется при изменении структуры реляционной БД, которая приводит к минимальным изменениям в прикладных программах.
Среди недостатков реляционной модели данных необходимо назвать следующие:
низкая скорость при выполнении операции соединения;
большой расход памяти для представления реляционной БД. Хотя проектирование в ЗНФ рассчитано на минимальную избыточность (каждый факт представляется в БД один раз), другие модели данных обеспечивают меньший расход памяти для представления тех же фактов. Например, длина адреса связи обычно намного меньше, чем длина значения атрибута.
Однако указанные недостатки можно предусмотреть и устранить, в то время как в ИМД и СМД отдельные недостатки устранить весьма сложно либо даже невозможно.
Именно реляционная модель данных находит все более широкое применение в практике автоматизации информационного обеспечения профессиональной деятельности.
Подавляющее большинство СУБД, ориентированных на персональные ЭВМ, являются системами, построенными на основе реляционной модели данных, так называемыми «реляционными» СУБД.
Контрольные вопросы 7 главе
Что такое модель данных?
Что такое база данных и что она должна отражать?
Что осуществляется на этапе инфологического (информационно-логического) проектирования БД?
Что представляет собой семантическая модель?
Что является главной особенностью сущности?
Что определяет связь «один к одному», «один ко многим»?
Что называется ключом?
Что такое элемент данных, агрегат данных, запись, набор данных?
Что такое ограничения целостности данных?
На чем основана иерархическая модель данных?
Что служит основной единицей обмена в иерархической модели данных?
Что необходимо для определения иерархической модели базы данных?
Что называется записью иерархической базы данных?
Допустимость только навигационного принципа доступа к данным — это недостаток или достоинство ИМД?
Что положено в основу сетевой модели данных?
Что называется веерным отношением W(R,S)?
Какие ключи различают в сетевой БД?
Что положено в основу реляционной модели данных?
Как называются строка и столбец таблицы в РМД? Что такое домен?
Чему присваиваются имена в РМД?
В отношениях РМД каков порядок следования кортежей и атрибутов?
Какая операция называется проекцией и выборкой в РМД?
Чем отличаются операции пересечения и объединения в отношениях РМД?
Что называется нормальной формой и нормализацией отношений РМД?
Какое отношение находится в 1НФ?
На что ориентированы применяемые ограничения в РМД?
Какое отношение называется вероятным ключом в РМД?
Какое отношение называется первичным ключом в РМД?
Что является обязательным условием для работы с РМД?
Какое отношение считается нормализованным?
Что является недостатком РМД?