
- •Лекция 9. Проектирование фактографических ис и хранилищ данных. Подходы к проектированию бд. Этапы нисходящего подхода к проектированию баз данных. Проектирование хранилищ данных.
- •9.1. Подходы к проектированию баз данных
- •9.2. Этапы нисходящего подхода к проектированию баз данных
- •9.3. Проектирование хранилищ данных
- •Проектирование схем типа „звезда"
Проектирование схем типа „звезда"
Схема "звезда" – Логическая структура, в центре которой находится таблица фактов (с детальными данными), окруженная таблицами размерностей (со ссылочными данными).
Схема "звезда" обладает логической структурой, в центре которой находится таблица фактов с детальными данными, окруженная справочными данными, помещенными в таблицы размерностей. Таблица фактов содержит внешний ключ для каждой таблицы размерностей. Эта структура отражает то, что фактические данные были созданы некими событиями в прошлом и вряд ли изменятся, независимо от того, как они анализируются. Поскольку основная часть информации в хранилище данных представлена в виде фактов, то размер таблицы фактов гораздо больше размера таблиц размерностей. Поэтому важно рассматривать факты как справочные данные, доступные только для чтения и неизменные с течением времени.
Для выделения фактических данных из данных размерностей необходимо установить основные транзакции внутри каждого бизнес-приложения. Для каждой таблицы фактов следует определить ключевые размерности, которые будут использоваться для всех фактов.
Основная цель проектирования таблиц фактов заключается в том, чтобы найти компромисс между ценностью хранимых данных и стоимостью их хранения. Размер таблиц фактов может быть огромным и превышать 1 терабайт (1012 байт). Поэтому для оптимального проектирования базы данных необходимо учесть факторы, перечисленные ниже.
Определение требуемого времени отклика для каждого приложения поддержки принятия решения.
Поиск компромисса между необходимостью использования статистических выборок подмножеств данных и необходимостью обработки детальных сведений.
Определение удаляемых столбцов.
Сокращение размера столбцов таблицы фактов.
Определение наилучшего способа применения настраиваемых и ненастраиваемых внешних ключей.
Определение оптимального подхода для введения в таблицу фактов размерности "время".
Секционирование таблиц фактов для улучшения их управляемости.
Завершив создание таблицы фактов, следует приступить к проектированию таблиц размерностей. Для хранения этих таблиц обычно требуется гораздо меньше пространства, поскольку они существенно меньше (< 5 ГБ) таблиц фактов. По этой же причине перестройка таблиц размерностей является менее затратной процедурой, но только при условии, что первичные ключи таблиц фактов остаются неизменными.
Схема "звезда" может использоваться для повышения производительности выполнения запросов путем денормализации справочной информации с образованием единой таблицы размерностей. Измерения в схеме "звезда" обычно проектируются на основе известного использования данных обычными запросами, тогда как большая часть новых запросов, вероятно, будет выполняться за счет анализа таблицы фактов с учетом некоторых ограничений, установленных для единственной размерности.
Выполнение запросов может быть ускорено за счет размещения всей ограничивающей информации в одной таблице. На практике эта цель достигается с помощью денормализации всех дополнительных данных, связанных с сущностью, в единую таблицу размерности в схеме "звезда".
Схема „снежинка"
Схема "снежинка" – Вариант схемы "звезда", в котором каждая размерность может иметь свои собственные размерности.
В этом случае таблицы размерностей не содержат денормализованных данных.
Схема „звезда-снежинка"
Схема "звезда-снежинка" – Гибридная структура, которая включает комбинацию денормализованной схемы "звезда" и нормализованной схемы"снежинка".
В этом случае некоторые размерности могут быть представлены в обеих формах для удовлетворения потребностей разных запросов.
Л10.
МПФБД