3.4. Многомерная модель
Многомерность модели означает многомерное логическое представление структуры информации, а не многомерность визуализации данных. Многомерная модель предназначена для аналитической обработки информации.
В данной модели используются такие понятия, как агрегируемость, историчность, прогнозируемость данных.
Агрегируемость данных означает возможность их рассмотрения с различным уровнем обобщения.
Историчность обеспечивает высокий уровень статичности (неизменяемости) данных и их взаимосвязей, а также в обязательном порядке привязку данных к временным точкам. Временная привязка данных необходима для получения результатов в различные периоды времени.
Прогнозируемость данных подразумевает задание функций прогнозирования и применение их к различным интервалам времени.
Приведем представление данных о продажах автомобилей дилером фирмы Опель по реляционной и многомерной моделям (см. рис. 3.1).
Марка автомобиля |
Месяц |
Объем продаж |
Опель-Астра |
Январь |
12 |
Опель-Астра |
Февраль |
24 |
Опель-Астра |
Март |
5 |
Опель-Вектра |
Январь |
2 |
Опель-Вектра |
Февраль |
18 |
Опель-Омега |
Февраль |
19 |
а) реляционная модель
-
Марка
автомобиля
Январь
Февраль
Март
Опель-Астра
12
24
5
Опель-Вектра
2
18
0
Опель-Омега
0
19
0
б) двумерная модель
Рис. 3.1. Представление данных в реляционной и многомерной моделях
Основными понятиями, с которыми оперирует пользователь в многомерной модели, являются понятия – измерение и ячейка.
Измерение – это множество однотипных данных, образующих одну из граней многомерного гиперкуба. Примерами наиболее часто используемых временных измерений являются дни, месяцы, кварталы и годы. В качестве географических измерений широко употребляются города, районы, регионы и страны.
Ячейка – это поле, значение которого однозначно определяется фиксированным набором измерений. В выше приведенной таблице б) значение ячейки объема продаж однозначно определяется комбинацией временного измерения Месяц и Марки автомобиля.
Многомерную модель, отображающую объемы продаж автомобилей менеджерами по годам, можно представить в виде трехмерного куба (см. рис. 3.2).
В многомерной модели данных используется два варианта организации данных – гиперкубическая и поликубическая.
В гиперкубической все кубы определяются одним и тем же набором измерений (максимально возможным). В некоторых случаях информация может быть избыточной, так как требуется обязательное заполнение ячеек.
В поликубической определяются несколько гиперкубов с различной размерностью и различными измерениями в качестве граней.
Для извлечения данных из базы, организованной по многомерной модели, применяется ряд специальных операций: срез, вращение, агрегация и детализация.
Срез представляет собой данные, полученные в результате фиксации одного или нескольких измерений. Например, если сделать срез в базе, организованной по трехмерной модели, по марке автомобиля Опель-Астра, то получим двухмерную таблицу продаж этой марки различными менеджерами по годам.
Операция вращение применяется в основном при двухмерном представлении данных. Суть ее заключается в изменении порядка при визуальном представлении данных (меняются местами оси X и Y). Для многомерного случая операция вращения представляет собой процедуру изменения порядка следования измерений.
Операции агрегации и детализации означают соответственно переход к более или менее детальному представлению информации из гиперкуба. В гиперкуб, представленный на рис. 2.8, могут быть добавлены измерения по иерархии снизу-вверх: Подразделение (в котором работает менеджер), Регион, Фирма, Страна. В этом случае можно получать информацию не только по объемам продаж отдельных менеджеров, но и по подразделениям, а также по регионам, фирмам, странам.
Достоинством многомерной модели является удобство и эффективность аналитической обработки больших объемов данных, связанных с временными интервалами. При организации таких же данных по реляционной модели происходит рост трудоемкости операций выборки и существенное увеличение затрат памяти компьютера на хранение данных.
Недостатком является громоздкость для простейших задач оперативной обработки информации.
Необходимо отметить, что исследования в области моделей данных продолжаются.