Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информатизация инженерного образования (выпуск 1)

.pdf
Скачиваний:
104
Добавлен:
28.06.2014
Размер:
22.7 Mб
Скачать

Гл а в а 16. Новые технологии в информатизации образования

обработку запроса к базе данных, результатом которого является список объектов, удовлетворяющих запросу. Например, функция поиска объектов по географическому названию, по справочной информации, по статистическим показателям;

• позиционирование найденного объекта или группы объектов на карте

вукрупненном (подробном) масштабе;

формирование тематических карт с показом различий в качественном состоянии объектов на текущий момент с помощью разных картографических способов изображения: значкового, картограммы, картодиаграммы;

нанесение пользователем на карту собственных значков с подписью. Набор

значков согласовывается с требованиями соответствующих учебных курсов

ипредметов среднего и профессионального образования;

подготовка макета печати карты;

сохранение растрового картографического изображения и уникальной URLссылки на него;

отсылка карты по e-mail (электронной почте) в виде уникальной URL-ссылки

икомментированного текста.

Технология, функции и интерфейсы основных карт и вспомогательных страниц ИКС должны обеспечивать возможность сохранения любого количества картографических изображений и организации любого количества URL-ссылок на любые картографические темы и сюжеты (спозиционированные карты с определенно настроенным тематическим содержанием), которые могут размещаться на webресурсах зарегистрированных пользователей, в целях интеграции ИКС в их логическую и информационную среду.

Интерактивный картографический Интернет-сервис реализует образный (интуитивный) интерфейс, способный предоставить возможности полнофункциональной работы с картой неподготовленному пользователю. Для этого используются графические элементы и вспомогательные текстовые сообщения и ссылки. Основным элементом страницы является фрагмент картографического изображения, настроенный пользователем с помощью функций и сервисов, а также навигатор (уменьшенная копия карты), показывающий местоположение фрагмента относительно всей карты.

16.1.7.Интеграция интерактивного картографического сервиса

вИнтернет-порталы

Правомерность включения ИКС в линейку общих Интернет-сервисов крупных Интернет-порталов обусловлена его высокой универсальностью как по отношению

кдругим Интернет-сервисам (линейкам новостей, поисковым машинам, системам организации опросов и статистики посещений и т.д.), в содержимом которых присутствует территориально координированная информация, так и по отношению

кобразовательно-предметным областям знаний, для которых карты являются одним из обязательных или рекомендуемых учебно-методических материалов.

Как показывает мировой и отечественный опыт создания картографических Интернет-ресурсов, разработка, создание и поддержка ИКС является достаточно сложной информационно-технологической проблемой, решение которой требует особого опыта и навыков работы с Интернет- и ГИС-технологиями, цифровыми картографическими материалами. Именно поэтому этот сервис все чаще развивается в Интернете главным образом в виде ASP-услуг (Application Service Provision).

663

ЧА С Т Ь 3. ТЕХНОЛОГИИ ИНФОРМАТИЗАЦИИ ОБРАЗОВАНИЯ

ВИнтернет-порталах ИКС способен эффективно выполнять следующие функции: 1. Информационно-справочные услуги, касающиеся образно-картографиче-

ского отражения местоположения отдельных объектов или инфраструктуры в целом. Сервис сопрягается со справочными базами данных, имеющими адресную (географическую) привязку к картографическим основам. По результатам поиска найденные объекты или группы объектов отображаются на интерактивной карте.

2.Услуги по тематическому картографическому моделированию и анализу геоинформационных ресурсов.

3.Услуги по организации взаимодействия посетителей портала с базами данных и хранилищами документов, в том числе распределенными, имеющими в качестве одного из атрибутов их описания пространственную привязку (образно-кар- тографический интерфейс пользователя).

4.Услуги по повышению эффективности работы средств поиска информации (машин поиска) в части учета пространственных свойств запрашиваемой информации, например местоположения или географических названий, с возможностями картографического представления результатов поиска.

Как правило, ИКС разрабатывается, позиционируется и поддерживается как автономный картографический сервер, состоящий из «машины» по генерации картографических изображений, средств управления «машиной», баз картографических и атрибутивных данных, типовых шаблонов выходных документов, средств сопряжения сервера с другими сервисами и базами данных порталов.

С учетом роста потребностей пользователей Интернет, прежде всего в картографических материалах (актуальных, качественных и интерактивных), вызванного общим повышением мобильности людей, усложнением территориальной инфраструктуры сред обитания (городов, местностей), картографические Интернет-ре- сурсы и сервисы (в количественном и качественном отношении) должны развиваться более быстрыми темпами, нежели другие информационные ресурсы глобальной сети.

Это означает переход от представления и интерпретации карт как статичных документов к получению географической информации в процессе интерактивных запросов в различной форме. В технологическом аспекте будет наблюдаться переход от частичной взаимной интеграции элементов ГИС- и Интернет-технологий и сервисов к более глубокой. Такая интеграция может развиваться в нескольких направлениях и будет связана с встраиванием картографического сервиса в тематические базы данных для обеспечения и визуализации географических запросов, в поисковые системы для обеспечения поиска с учетом географических предпочтений, в системы обработки текстов, например новостей, для обеспечения дополнительного картографического представления содержания.

16.2.Технологии оперативного анализа данных

вобразовательных учреждениях

Эффективное управление крупным бизнесом, предприятием, отраслью в настоящее время невозможно без применения современных технологий сбора, хранения, обработки и анализа больших объемов информации. Постоянно растущий спрос на специализированные информационные системы привел к бурному

664

Г л а в а 16. Новые технологии в информатизации образования

развитию информационных технологий и появлению множества новых понятий. Одним из таких понятий является термин OLAP (Online Analytical Processing — оперативный анализ данных).

В области информационных технологий (ИТ) существуют два взаимодополняющих направления развития:

создание информационных систем, ориентированных на операционную обработку данных;

создание информационных систем, ориентированных на анализ данных.

Результатом работы по первому направлению является создание систем обработки данных, основанных на технологии OLTP (Online Transaction Processing — оперативная обработка транзакций). Целью внедрения таких систем является автоматизация обработки информационных потоков в рамках предприятия. Примером таких систем может служить система бухгалтерского учета на предприятии «1C-Бухгалтерия» отечественной фирмы «1С».

Характерной особенностью OLTP-систем является постоянное изменение данных, поскольку любой документ или процесс отражается на состоянии данных (изменяется сальдо на счете, делаются записи в журналах или оперативных регистрах). В то же время структура данных изменяется крайне редко и является следствием появления новых бизнес-процессов, которые, в свою очередь, появляются при новом виде деятельности или же при реорганизации предприятия. В системах OLTP информация организуется в максимально возможном нормализованном виде (т.е. без дублирования) и, как правило, хранится в реляционных базах данных.

Концепция реляционных баз данных была разработана в 60—80 годах математиком и программистом Эдгаром Коддом (Edgar Frank 'Ted' Codd). Системы управления базами данных, основанные на реляционном подходе RDBMS (Relational Data Base Management System — система управления реляционными базами данных), в настоящее время являются основным средством создания OLTP-систем в силу простоты, надежности и широкого распространения. Средством доступа к реляционным данным служит язык SQL (Structured Query Language — язык структурированных запросов), ставший стандартом в 1989 г., а затем обновленный до нового стандарта SQL2 в 1992 г.

Внедрение и использование систем обработки данных на предприятии позволяет решить проблему сбора, хранения и обработки корпоративной информации. Применение таких систем необходимо для функционирования предприятия. Но руководителю предприятия требуется нечто иное. Ему хотелось бы иметь мощный инструмент анализа данных, систему, позволяющую оперативно и объективно оценить ситуацию и принять решение. Необходимость существования таких систем привела к развитию второго направления в области ИТ — созданию систем поддержки принятия решений (СППР).

Первые СППР существовали в виде надстроек к реляционным базам данных, позволяющим делать выборки данных на основе языка SQL. Однако вскоре стало понятно, что такие системы не удовлетворяют нуждам аналитиков и управленцев, для которых они, собственно, создавались, в силу существования ряда принципиальных ограничений (прежде всего по сложности составления и скорости выполнения SQL-запросов) при проведении анализа данных, имеющих реляционную

665

Ч А С Т Ь 3. ТЕХНОЛОГИИ ИНФОРМАТИЗАЦИИ ОБРАЗОВАНИЯ

структуру. Возникла необходимость создания нового подхода к структурированию информации и методам ее представления.

В 1993 г. вышла статья Эдгара Кодда [16.5], в которой он впервые определил

ииспользовал термин OLAP. Несмотря на то что попытки создания моделей представления данных, отличных от реляционной, предпринимались с 60-х годов, именно дата выхода статьи Кодда считается днем рождения технологии OLAP — оперативного анализа данных на основе многомерного представления. Именно многомерность представления данных является ключевой особенностью OLAP

иделает механизм выборки требуемых данных более доступным и интуитивно понятным аналитику, а скорость получения данных позволяет говорить о возможности проведения оперативного анализа.

Понятие OLAP тесно связано с концепцией хранилищ данных (Data Warehouse). Хранилище данных — это интегрированный накопитель информации, собранной из других источников, в том числе и систем OLTP. Хранилище данных ориентировано на бизнес-понятия, а не на бизнес-процессы и содержит всю информацию, относящуюся к этим понятиям. Эта информация собирается из оперативных систем за согласованные периоды времени и не подвержена оперативным изменениям. Данные в хранилище существенно денормализованы (т.е. обладают избыточностью) для повышения производительности выполнения запросов. Как правило, хранилище данных организовано на основе реляционной БД по схеме «звезда» или «снежинка» [16.6]. Данные загружаются в хранилище с помощью так называемых ETL-алгоритмов (Extraction, Transformation, Loading — извлечение, преобразование, загрузка). Поиск ценной информации в крупном хранилище может осуществляться средствами Data Mining (технология интеллектуального анализа и добычи данных). Хранилище данных используется в качестве непосредственного «поставщика» информации для систем анализа данных на основе OLAP.

Сегодня ни одна из серьезных аналитических систем не обходится без применения OLAP и хранилищ данных. Современные системы поддержки принятия решений, средства BI (Business Intelligence — анализ и обработка данных масштаба предприятия), CRM (Customer Relationship Management — повышение эффективности взаимодействия с клиентами), ERP (Enterprise Resource Planning — планирование ресурсов предприятия) основаны на OLAP или содержат его как компоненту.

Ведущие фирмы-производители программного обеспечения и баз данных Oracle, Microsoft, Informix, Sybase содержат в числе своих продуктов средства построения хранилищ данных и аналитических систем на основе OLAP. Однако при всем многообразии программных продуктов ни одна из фирм не предоставляет законченного решения для конкретного предприятия или отрасли. Специализированные системы обработки и анализа данных создаются с помощью предлагаемых CASE-инструментариев (Computer Aided Software/System Engineering — средства автоматизированного создания информационных систем) в соответствии с предметной областью и требованиями заказчика.

Чем же именно так привлекательна технология оперативного анализа для пользователей и производителей OLAP-систем? Целью дальнейшего изложения основ теории OLAP, а также сведений о популярных программных продуктах этого класса является попытка ответить на этот вопрос.

666

Гл а в а 16. Новые технологии в информатизации образования

16.2.1.Определение OLAP

Термин OLAP впервые появился в 1993 г. в статье Эдгара Кодда с партнерами, опубликованной при поддержке Arbor Software (ныне Hyperion Solutions). В статье было предложено 12 правил, которым должен удовлетворять программный продукт класса OLAP. Эти правила, являясь, по сути, определением OLAP, оказались весьма сложны для восприятия, противоречивы и были в последствии переработаны Найгелем Пендсом, автором журнала OLAP Report (http://www.olapreport.com), в совокупность пяти правил, получивших название тест FASMI (Fast Analysis of Shared Multidimensional Information — быстрый анализ разделяемой многомерной информации). Это определение было сформулировано в начале 1995 г. и с тех пор не нуждалось в пересмотре. Приведем развернутую формулировку теста FASMI с комментариями автора.

Fast (быстрый) — означает, что система должна обеспечивать выдачу большинства ответов пользователям в пределах приблизительно 5 с. При этом самые простые запросы обрабатываются в течение 1 с и очень немногие — более 20 с.

Недавнее исследование в Нидерландах показало, что конечные пользователи воспринимают процесс неудачным, если результаты не получены по истечении 30 с. Они способны нажать «Alt + Ctrl + Del», если система не предупредит их, что обработка данных требует больше времени. Даже если система предупредит, что процесс будет длиться существенно дольше, пользователи могут отвлечься и потерять мысль, при этом качество анализа страдает. Такую скорость не просто достигнуть с большими количествами данных, особенно если требуются специальные вычисления «на лету». Поставщики прибегают к широкому разнообразию методов, чтобы достигнуть этой цели, включая специализированные формы хранения данных, обширные предварительные вычисления или же ужесточая аппаратные требования. Полностью оптимизированных продуктов нет, так что это будет областью развития технологии.

В частности, подход предварительных вычислений дает сбои с очень большими, разреженными приложениями, так как базы данных просто становятся слишком большими (проблема взрыва базы данных). Выполнение вычислений «на лету» слишком медленное при работе с большими базами данных, даже при использовании экзотических аппаратных средств. На первый взгляд может казаться удивительным, что при получении отчета за минуту, на который не так давно требовались дни, пользователь очень быстро начинает скучать во время ожиданий, и проект оказывается менее успешным, чем в случае мгновенного ответа, даже ценой менее детального анализа.

Analysis (анализ) означает, что система может справляться с любым логическим и статистическим анализом, характерным для данного приложения, и обеспечивает его сохранение в виде, доступном для конечного пользователя. Хотя некоторое «предварительное программирование» может быть необходимо, подход, при котором все прикладные определения должны быть выполнены профессионалом, является неприемлемым.

Естественно, необходимо позволить пользователю определять новые специальные вычисления как часть анализа и формировать отчеты любым желательным способом без необходимости программирования, поэтому следует исключить продукты (подобно Oracle Discoverer 3.1), которые не предоставляют гибкие средства

667

Ч А С Т Ь 3. ТЕХНОЛОГИИ ИНФОРМАТИЗАЦИИ ОБРАЗОВАНИЯ

вычислений, ориентированные на конечного пользователя. Не так важно, выполнен ли этот анализ в собственных инструментальных средствах поставщика или в связанном внешнем программном продукте типа электронной таблицы, просто все требуемые функциональные возможности анализа должны обеспечиваться интуитивным способом для конечных пользователей. Средства анализа могли бы включать определенные процедуры типа анализа временных рядов, распределения затрат, валютных переводов, поиска целей, изменения многомерных структур, непроцедурного моделирования, выявления исключительных ситуаций, извлечения данных и другие операции, зависимые от приложения. Такие возможности широко варьируются в зависимости от целевой ориентации.

Shared (разделяемый) означает, что система осуществляет все требования защиты конфиденциальности (возможно, до уровня ячейки) и, если множественный доступ для записи необходим, обеспечивает блокировку модификаций на соответствующем уровне. Не во всех приложениях есть необходимость обратной записи данных. Однако количество таких приложений растет, и система должна быть способна обработать множественные модификации своевременным безопасным способом. Это главная слабость многих OLAP-продуктов, которые имеют тенденцию предполагать, что во всех приложениях OLAP требуется только чтение, и предоставляют упрощенные средства защиты. Даже продукты с многопользовательским чтением — записью часто имеют сырые модели защиты, например Microsoft OLAP Services.

Multidimensional (многомерный) — ключевое требование. Система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий, поскольку это определенно наиболее логичный способ анализировать бизнес и организации. Минимальное число измерений, которые должны быть обработаны, не устанавливается, поскольку оно также зависит от приложения, и большинство продуктов OLAP имеет достаточное количество измерений для тех рынков, на которые они нацелены.

Information (информация). Необходимая информация должна быть получена там, где она необходима. Однако многое зависит от приложения. Измерение мощности различных продуктов осуществляется в терминах того, сколько входных данных они могут обрабатывать, но не сколько гигабайт они могут хранить. Мощность продуктов весьма различна. Самые большие OLAP-продукты могут оперировать, по крайней мере, в тысячу раз большим количеством данных по сравнению с самыми маленькими. По этому поводу следует учитывать много факторов, включая дублирование данных, требуемую оперативную память, использование дискового пространства, эксплуатационные показатели, интеграцию с информационными хранилищами и т.п.

Резюмируем это обширное определение. OLAP-система — это прежде всего удобный и мощный инструмент анализа данных. Удобство состоит в оперативности получения требуемой информации. Многомерное представление данных в OLAP-системе является интуитивно понятным пользователю, и для получения необходимой информации ему не требуется изучать структуру базы данных или привлекать специалиста по составлению отчетов. Мощь OLAP состоит в возможности получения любых требуемых данных, как обобщенных, так и детализированных, на всех этапах анализа.

Технология OLAP — это совокупность методов и средств создания OLAP-систем.

668

Гл а в а 16. Новые технологии в информатизации образования

16.2.2.Область применения OLAP-систем

Все дело в том, что широко распространенные системы управления реляционными базами данных, зарекомендовавшие себя в качестве простого и надежного средства оперативной обработки данных, оказались мало эффективными при решении задач аналитической обработки. Конечно, средствами традиционных СУБД можно построить заранее регламентированный аналитический отчет и даже прогноз какого-либо показателя на следующий год.

Но, как правило, после просмотра такого отчета у пользователя (аналитика) появится не готовый ответ, а новая серия вопросов. Однако если бы ему захотелось получить ответ на новый вопрос, он может ждать его часы, а иногда и дни. Обычно каждый новый не предусмотренный заранее запрос должен быть сначала формально описан, передан программисту, запрограммирован и, наконец, выполнен. Но после того как аналитик получит долгожданный ответ, достаточно часто оказывается, что решение уже принято или, что случается еще чаще, произошло взаимное непонимание и получен ответ совсем не на тот вопрос. Впрочем, не намного меньшее время затрачивается и на получение ответа и на заранее описанный и запрограммированный запрос.

Кроме того, для решения большинства аналитических задач, скорее всего, потребуется использование внешних по отношению к СУБД специализированных инструментальных средств (надстроек). Выполнение большинства аналитических функций (например, построение прогноза) невозможно без предположения об упорядоченности данных. Но в реляционных СУБД предполагается, что данные не упорядочены. Естественно, здесь имеется возможность после выборки данных выполнить их сортировку и затем аналитическую функцию. Это потребует дополнительных затрат времени на сортировку. Сортировка должна будет проводиться каждый раз при обращении к этой функции, и, самое главное, такая функция может быть определена и использована только во внешнем по отношению к СУБД пользовательском приложении и не может быть встроенной функцией языка SQL.

В конечном счете пользователя, занимающегося анализом, редко интересуют детализированные данные. Более того, чем выше уровень пользователя (руководителя, управляющего, аналитика), тем выше уровень агрегации данных, используемых им для принятия решения. Соответственно больше времени требуется на суммирование данных, хранящихся в СУБД.

Очевидно, что при достаточно сложной структуре базы данных и большом объеме исходной информации средства системы управления не позволяют провести оперативный анализ данных. Таким образом, если необходима оперативность получения данных, а в более широком смысле функциональность, определенная тестом FASMI, — не обойтись без OLAP.

Конечной целью использования OLAP является анализ данных и представление результатов этого анализа в виде, удобном для восприятия и способствующем принятию актуального и правильного решения. Поэтому OLAP является ключевым компонентом систем поддержки принятия решений [16.7]. На рис. 16.4 представлена обобщенная схема для системы поддержки принятия решений.

Заметим, что компонент Data Mining на практике встречается редко. Существующие реализации Data Mining еще далеки от совершенства, однако это направление является перспективным при обработке крупных объемов разносортных данных.

669

Ч А С Т Ь 3. ТЕХНОЛОГИИ ИНФОРМАТИЗАЦИИ ОБРАЗОВАНИЯ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#$ %

 

 

!"

 

 

&'(' )*+*+,"

 

 

 

 

 

.

&'(' /'0123451"

-!"

Рис. 16.4. Система поддержки принятия решений

Поддержка принятия решения на основе OLAP обеспечивает решение следующих задач:

1. Обобщение. Детализированные данные предоставляются пользователю в агрегированном (суммированном) виде, позволяя провести глобальную оценку ситуации, выявить общие закономерности исследуемого процесса.

2.Визуализация. Большинство людей, в том числе аналитиков, обладает образным мышлением, поэтому отчет, предлагаемый в графическом виде, воспринимается ими куда более эффективно, нежели «голые» числовые данные. Для повышения эффективности восприятия отчетов используются различные схемы графической визуализации, такие как столбчатые и круговые диаграммы, графики, отображение данных на географической карте.

3.Моделирование подразумевает создание модели реального процесса и исследование ее свойств с целью поиска ответа на вопрос: «Что если?» При этом рассматриваются всевозможные ветви поведения исследуемой системы при возникновении различных возмущений.

4.Прогнозирование. Пожалуй, самая востребованная и в то же время труднореализуемая функция аналитических систем. В настоящее время применяется множество методик прогнозирования, однако существующие реализации прогностических методов далеки от идеала.

Таким образом, целью применения OLAP-систем является поддержка принятия управленческих решений на основе анализа исторических данных. В настоящее

670

Г л а в а 16. Новые технологии в информатизации образования

время СППР переходят из традиционно более развитого в этом направлении биз- нес-сектора в другие отрасли, адаптируясь под нужды различных, в том числе государственных управленческих структур.

Для создания и использования этих систем на практике необходимо иметь представление о принципах организации данных и формирования запросов в OLAPсистемах.

16.2.3. Многомерная модель данных

Многомерное представление данных

Что такое многомерное представление, откуда появляется многомерность в трехмерном мире, чем оно отличается от ставшего уже привычным реляционного представления и, наконец, откуда среди нас появились люди, мыслящие в четырех и более измерениях? Такие вопросы возникают практически у любого, впервые услышавшего о многомерном представлении данных.

Справедливости ради стоит отметить, что эта формулировка выглядит грозно только на первый взгляд. Ведь человеку действительно присуща многомерность мышления. Попытаемся разобраться с этим понятием на примере отечественной фирмы по продаже импортных автомобилей.

Достаточно очевидно, что даже при небольших объемах данных отчет, представленный в виде двухмерной таблицы (модели автомобиля по оси Y и время по оси X), нагляднее и информативнее отчета с реляционной построчной формой организации.

Реляционная модель

 

Модель

 

Месяц

 

Объем продаж

 

 

 

 

 

 

 

 

 

 

Audi

 

Июнь

12

 

 

Audi

 

Июль

24

 

 

Audi

 

Август

5

 

 

Mercedes

 

Июнь

2

 

 

Mercedes

 

Июль

18

 

 

Mercedes

 

Август

1

 

 

BMW

 

Июнь

10

 

 

BMW

 

Июль

19

 

 

BMW

 

Август

3

 

 

 

 

 

 

 

 

 

 

 

Многомерная модель

 

 

 

 

 

 

 

Модель

 

Июнь

 

Июль

 

Август

 

 

 

 

 

 

 

 

 

 

Audi

 

12

 

24

 

5

 

 

Mercedes

 

2

 

18

 

1

 

 

BMW

 

10

 

19

 

3

 

 

 

 

 

 

 

 

 

 

А теперь представим, что у нас не три модели, а 30 и не три, а 12 различных месяцев. В случае построчного (реляционного) представления получим отчет в 360 строк (30×12), который займет пять-шесть страниц. В случае же многомерного (в нашем случае двухмерного) представления получим достаточно компактную таблицу, состоящую из 12 столбцов и 30 строк, которая вполне уместится на одной странице и которую, даже при таком объеме данных, можно реально оценивать и анализировать.

671

ЧА С Т Ь 3. ТЕХНОЛОГИИ ИНФОРМАТИЗАЦИИ ОБРАЗОВАНИЯ

Икогда говорится о многомерной организации данных, вовсе не подразумевается, что данные представляются конечному пользователю (визуализируются) в виде четырехили пятимерных гиперкубов. Это невозможно, да и пользователю более

привычно и комфортно иметь дело с двухмерным табличным представлением и двухмерной бизнес-графикой. Поэтому, когда говорится о многомерности, имеется в виду не многомерность визуализации, а многомерное представление при описании структур данных и поддержка многомерности в языках манипулирования данными.

Основными понятиями, с которыми оперирует пользователь и проектировщик

вмногомерной модели данных, являются:

измерение (Dimension);

метки (Menders);

ячейка (Cell);

показатель (Measure).

Измерение — это множество однотипных данных, образующих одну из граней гиперкуба. Например, дни, месяцы, кварталы, годы (наиболее часто используемые в анализе временные измерения). Примерами географических измерений являются города, районы, регионы, страны и т.п.

Значения, «откладываемые» вдоль измерений, называются членами измерения, или метками. Метки используются как для «разрезания» куба, так и для ограничения (фильтрации) выбираемых данных, когда в измерении, остающемся «неразрезанным», интересны не все значения, а их подмножество, например три города из нескольких десятков. Значения меток отображаются в двухмерном представлении куба как заголовки строк и столбцов.

Ячейка — это поле (обычно цифровое), которое однозначно определяется фиксированным набором меток.

Cодержимое ячейки есть показатель, определяемый следующим образом:

как переменная (Variable) — значения таких показателей один раз вводятся из какого-либо внешнего источника или формируются программно и затем в явном виде хранятся в многомерной базе данных;

как формула (Formula) — значения таких показателей вычисляются по некоторой заранее заданной формуле, т.е. для показателя, имеющего тип «формула»,

вбазе данных хранятся не его значения, а формула, по которой они вычисляются.

Заметим, что это различие существует только на этапе проектирования и полностью скрыто от конечных пользователей.

В примере на рис. 16.5 каждое значение поля «Объем продаж» однозначно определяется комбинацией полей «Марка автомобиля» и «Месяц продаж».

Но в реальной ситуации для однозначной идентификации значения показателя, скорее всего, потребуется большее число измерений, например «Марка автомобиля», «Менеджер», «Время» (например, год). Измерения: «Время (год)» — 2000, 2001, 2002. «Менеджер» — Иванов, Петров, Сидоров. «Показатель» — объем продаж.

И в терминах многомерной модели речь будет идти уже не о двухмерной таблице, а о трехмерном кубе. Первое измерение — «Марка автомобиля», второе — «Менеджер, продавший автомобиль», третье — «Время (год)». На пересечении граней куба находятся значения показателя «Объем продаж».

Заметим, что, в отличие от измерений, не все значения показателей должны иметь и имеют реальные значения. Например, менеджер Петров в 2000 г. мог еще не работать в фирме, и в этом случае все значения показателя «Объем продаж» за этот год будут иметь значения «Нет данных».

672