Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kurs.rtf
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
23.54 Mб
Скачать

Концепция многомерной модели данных

В службах SQL Server Analysis Services используется унифицированная многомерная модель данных (Unified Dimensional Model, UDM). Эта модель позволяет различным клиентским приложениям получить доступ к данным из реляционных и многомерных БД без применения различных моделей (рисунок 2.7). Роль унифицированной многомерной модели заключается в создании моста между пользователем и источниками данных [2, 3]. Модель UDM конструируется на одном или нескольких источниках данных. Пользователь запрашивает модель UDM при помощи различных клиентских средств, например Microsoft Excel.

Рисунок 2.7 – Многомерная модель данных

Конечному пользователю это дает определенные преимущества, даже если модель UDM конструируется только как тонкий слой над источником данных: проще и легче можно понять модель данных; обеспечивается изоляция от гетерогенных серверных источников данных; повышается производительность при обработке запросов обобщенного типа. В некоторых сценариях простая модель UDM может конструироваться автоматически. Дополнительные вложения в создание унифицированной многомерной модели могут обеспечить дополнительные преимущества, вытекающие из богатства метаданных, которые может предоставить эта модель. Преимущества унифицированной многомерной модели данных:

  1. значительно обогащает пользовательскую модель;

  2. обеспечивает высокую производительность запросов, поддерживая интерактивный анализ даже на очень больших объемах данных;

  3. использует в модели бизнес-правила для поддержки более содержательного анализа данных;

  4. поддерживает «закрытие цикла»: пользователям позволяется действовать с данными, которые они видят на экране монитора.

Многомерная модель данных определяет представление данных на трех уровнях: концептуальной модели; физической модели; прикладной модели.

В терминах концептуальной модели пользователь описывает данные организации (предприятия): структуру и организацию данных; правила доступа; методы расчётов и преобразований. Модель используется в качестве моста между моделью предметной области и многомерной моделью данных. Для описания концептуальной модели используется Язык Описания Данных (Data Definition Language, DDL) и язык сценариев (Multidimensional Expressions, MDX).

Физическая модель основывается на концептуальной модели. Как и в случае реляционных БД, физическая модель определяет условия хранения данных на физических носителях:

• место хранения: тип файлов с данными, носитель информации, размещение носителя;

• способ хранения: в сжатом или несжатом виде, вид индексирования;

• правила доступа к данным, организацию кеширования данных, способ занесения и извлечения данных из памяти.

Для хранения всех видов информации в службах Analysis Services используется структура данных, называемая накопителем данных (Data store). Данные в накопителе сервера разделены и структурированы (рисунок 2.8). Основными элементами накопителя является поля, поддерживающие различные числовые типы данных размером от 1 до 8 байтов, а также строковые типы данных. Поля группируются в записи, содержащие набор данных для всех полей. Поле может быть помечено как пустое, т.е. содержащее значение null. В конце каждой записи для каждого потенциально пустого поля (столбца) добавляется один бит для указания пустого поля.

При передаче данных аналитическим приложениям прикладная модель также определяет их формат. Клиентское приложение непосредственно взаимодействует с прикладной моделью данных. Прикладная модель разрабатывается с применением Языка MDX. Посредством MDX выполняется описание модели формирования данных с включением MDX-сценариев (MDX Scripts) и представлений запросов к многомерной БД,

Рисунок 2.8 – структура записей и страниц

В многомерных БД для описания данных используется понятие многомерного пространства. В отличие от геометрического пространства многомерное пространство дискретно и содержит дискретное количество значений на каждом измерении. Пространство данных может иметь любое количество измерений. Для описания многомерного пространства используются следующие термины:

  1. измерение (dimension), описывающее элемент данных для анализа;

  2. элемент (member): соответствует одной точке на измерении.

  3. значение элемента (member value): уникальная характеристика элемента;

  4. атрибут (attribute): полная коллекция элементов одного типа;

  5. размер (size) или кардинальность (cardinality) измерения: количество элементов, которое содержит измерение.

На рисунке 2.9 приведено пространство данных с тремя измерениями

Рисунок 2.9 – Трехмерное пространство данных

Количество точек в пространстве данных образует теоретическое пространство данных. Размерность теоретического пространства математически определяется перемножением размеров всех измерений. Поскольку каждое измерение дискретно, то пространство является ограниченным (конечным). При описании многомерного пространства дополнительно используются следующие понятия:

  1. кортеж (tuple), определяющий координату в многомерном модельном пространстве;

  2. срез (slice), определяющий секцию многомерного модельного пространства, которая определяется кортежем.

Таким образом, каждая точка пространства данных определяется набором координат, который называется кортежем. Например, любая точка пространства на рисунке 1.11 определяется кортежем ( ), , , . Если зафиксировать элемент одного измерения, то получится срез в пространстве данных. Примером среза может служить , , , .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]