Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 2.docx
Скачиваний:
3
Добавлен:
23.09.2019
Размер:
123.55 Кб
Скачать

Лекция 2 Технологии хранения данных

В 2000 хранилище – реляционная, но не нормализованная БД. Следующий шаг – многомерная модель. В 2005 делается наоборот – сначала кубик, потом реляционная модель

Одним из направлений развития РБД в интересах систем принятия решений является разработка таблиц с денормализованной формой.

Структура такой базы данных не будет реляционной - это будет пространственная база данных с целью анализа данных, а не выполнения транзакций.

Денормализованные пространственные БД чаще всего выполняются в виде звезды: есть одна или несколько центральных таблиц – они называются таблицами фактов – где хранятся результирующие показатели, которые нас интересуют (результаты финансовой деятельности предприятия), которые мы будем анализировать. И есть несколько родительских таблиц – справочники, нормативные данные, индексы. Каждый факт сопровождается набором значений этих индексов. Это таблицы – измерения. Время – одно из таких измерений. На практике когда будете делать БД, придумайте достаточно большое количество сопутствующих данных для сущностей. По сути это обычная БД, но ненормализованная. Имеются избыточные данные – детальные и агрегированные. Это нереляционная БД – данные хранятся несколько раз в разном виде.

Технология называется Dimensional – размерная модель заключается в создании большой таблицы фактов и совокупности измерений.

Методология Dimensional

Нормализация данных в реляционных СУБД приводит к созданию множества связанных между собой таблиц. В результате, выполнение сложных запросов неизбежно приводит к объединению многих таблиц, что существенно увеличивает время отклика.

Создание хранилища данных подразумевает создание денормализованной структуры данных (допускается избыточность данных и возможность возникновения аномалий при манипулировании данными), ориентированной в первую очередь на высокую производительность при выполнении аналитических запросов.

Нормализация делает модель хранилища слишком сложной, затрудняет ее понимание и ухудшает эффективность выполнения запроса.

Как проектировать ненормализованную бд?

Большинство Case – средств проектирования БД поддерживает методологию моделирования хранилищ благодаря использованию специальной нотации для физической модели – Dimensional.

В современных case-средствах среди предлагаемых нотаций есть dimensional, которое предотвращает излишнее дробление таблиц до соответсия 1й, 2й, 3й, 4й, 5й НФ. Это ограничение для физической модели.

Особенности проектирования

Моделирование Dimensional сходно с моделированием связей и сущностей для реляционной модели, но отличаются целями.

Реляционная модель акцентируется на целостности и эффективности ввода данных.

Размерная (Dimensional) модель ориентирована в первую очередь на выполнение сложных запросов к БД.

Проектируем как обычную БД, но с условием, что все выходные данне лежат в одной таблице. Модель ориентирована на быстрое извлечение информации по любому набору измерений в уже готовом виде.

О схеме звезда

В размерном моделировании принят стандарт модели, называемый схемой звезда (star schema), которая обеспечивает высокую скорость выполнения запроса посредством денормализации и разделения данных.

Невозможно создать универсальную денормализованную структуру данных, обеспечивающую высокую производительность при выполнении любого аналитического запроса. Поэтому схема звезда строится так, чтобы обеспечить наивысшую производительность при выполнении одного самого важного запроса, либо для группы похожих запросов.

Звезда – самая простая базовая схема для построения ненормализованной пространственной БД, которую можно считать хранилищем. Звезда строится каждый раз отдельно в зависимости от предметной ориентированности. Измерения зависят как от предметной области, так и от потребностей, для которых создается витрина или хранилище.