Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
база данных.docx
Скачиваний:
167
Добавлен:
24.03.2015
Размер:
5.83 Mб
Скачать

2.5. Многомерная модель

Многомерный подход к представлению данных в базе появился практи­чески одновременно с реляционным, но реально работающих многомерных СУБД (МСУБД) до настоящего времени было очень мало. С середины 90-х годовинтерес к ним ста." приобрел ать массовый характер.

Толчком послужила в 1993 году программная статья одного из основопо­ложников реляционного полхода Э. Кодда. В ней сформулированы 12 основ ных требований к системам класса OLAP (OnLine Analviical Processing — оперативная аналитическая обработка), важнейшие из которых связаны с возможностями концептуального представления и обработки многомерных данных. Многомерные системы позволяют оперативно обрабатывать инфор­мацию для проведения анализа и приня гия решения.

В развитии концепций ИС можно выделить следующие два направления:

  • системы оперативной (транзакционной) обработки;

  • системы аналитической обработки (системы поддержки принятия решений).

Реляционные СУБД предназначались для информационных систем опе­ративнойобрабо тки информации ив этой области были весьма эффектив нь/ В системах ана литической обработки они показали себя несколько непо­воротливыми и недостаточно гибкими. Более эффективными здесь оказываются многомерные СУБД (МСУБД).

МногомерныеСУБД являются узкоспециализированными СУБД, пред­назначенными ю>я интеракт ивной аналитической обработки информации. Раскроем основные понятия, используемые и этих СУБД, агрегируемость, ис­торичность и прогнозируемость данных

Агрегируемостьданных означает рассмотрение информации на различных уровнях ее обобщения. В информационных системах степень детальности представления информации для пользовате. (Я зависит от его уроьня: анали­тик, пользователь-оператор, управляющий, руководитель.

Историчность данныхпредполагает обеспечение высокого уровня стат ич­ности (неизменности) собственно данных и их взаимосвязей, а гакже обяза­тельность привязки данных ко времени.

Статичность данных позво. шет испо 1Ьзовать при их обработке специали­зированные методы загрузки, хранения, индексации и выборки.

Еременнбя привязка данных необходима для частого выполнения запро­сов. имеющих значения времени и даты в состаье выборки. Необходимость упорядочения данных по времени в процессе обработ ки и преде гав ления дан­ных пользователю накладывает требования на механизмы хранения и досту­па к информации Так, для уменьшения времени обработки запросов жела­тельно, ч гобы данные всегда были отсортированы в том порядке, в котором они наиболее часто запрашиваются.

Прогнозируемостьданных подразумевает задание функций прогнозиро­вания и применение их к различным временным интерва лам.

Многомерность модели данных означает не многомерность визуализации цифровых данных, а многомерное логическое представ, гение структуры ин­формации при описании и в операциях манипулирования данными.

По сравнению с реляционной моделью многомерная организация данных обладает более высокой наг 1ядностпъюи информативностью.Для иллюст ра­ции на рис. 2.8 приведены реляционное (а)и многомерное (б) представления одних и тех же данных об объемах продаж автомобилей.

а)

Модель

Мегяц

О^ъем

«Жигули»

июнь

12

«Жигули»

июль

24

«Жи1 ули»

август

5

«Москвич»

июнь

2

«Москвич»

июль

18

«Волга»

июль

19

б)

Молель

WlOHb

Июль

Август

«Жигули»

12

24

5

«Москвич»

2

18

No

«Волга»

No

19

No

Рис 2.8. Реляционное и многомерное представление данных

Если речь идет о многомерной модели с мерностью бо ibuie двух, то не обя зателы.о визуально инфорл ация представляется в виде многомерных обьек тов (трех-, четырех и более мерных гиперкубов). По. [ьзователю и в этих слу­чаях более удобно иметь дело с двухмерными таблицами или графиками. Данные при этом пред< тавлчют собой «вырезки» (точнее, «срезы») из много­мерного хранилища данных, выполненные с разной степенью детачизациг

Рассмотрим основные понятия многомерных моделей данных, к числу ко­торых относятся измерение и ячейка.

Измерение(Dimension) - это множество однотипных данных, образующих одну из фаней гиперкуба. Примерами наиболее часто используемых времен­ных измерений яв тяются Дни, Месяцы, Кварталы и Годы. В качестве геогра

фических измерений широко употребляются Города, Районы. Регионы и Ст ра­ны. В многомерной модели данных измерения играют роль индексов, служащих для идентификации конкретных значений в ячейках гиперкуба

Ячейка(Cell) или показатель — это поле, значение которого однозначно определяется фиксированным набором измерений. Тип поля чаще всего оп­ределен как цифровой. В зависимости от того, как формируются значения некоторой ячейки, обычно она может быть переменной (значения изменяют­ся и могут быть загружены из внешнего источника данных или сформирова­ны программно) либо формулой (значения, подобно формульным ячейкам электронных таблиц, вычисляются по заранее заданным формулам)

В примере на рис. 2.8, б каждое значение ячейки Объем продаж однознач но определяется комбинацией временною измерения (Месяц продаж) и мо­дели автомобиля. На практике зачастую требуется большее количество из­мерений. Пример трехмерной модели данных приведен на рис. 2.9.

9

4

9

4

9

7 -

7

7

4