Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Средства OLAP (реферат)

.pdf
Скачиваний:
89
Добавлен:
28.06.2014
Размер:
367.07 Кб
Скачать

Discoverer 3.1), которые не предоставляют гибкие средства вычислений, ориентированные на конечного пользователя. Не так важно, выполнен ли этот анализ в собственных инструментальных средствах поставщика или в связанном внешнем программном продукте типа электронной таблицы, просто все требуемые функциональные возможности анализа должны обеспечиваться интуитивным способом для конечных пользователей. Средства анализа могли бы включать определенные процедуры, типа анализа временных рядов, распределения затрат, валютных переводов, поиска целей, изменения многомерных структур, непроцедурного моделирования, выявления исключительных ситуаций, извлечения данных и другие операции зависимые от приложения. Такие возможности широко отличаются среди продуктов, в зависимости от целевой ориентации.

SHARED (Разделяемой) означает, что система осуществляет все требования защиты конфиденциальности (возможно до уровня ячейки) и, если множественный доступ для записи необходим, обеспечивает блокировку модификаций на соответствующем уровне. Не во всех приложениях есть необходимость обратной записи данных. Однако количество таких приложений растет, и система должна быть способна обработать множественные модификации своевременным, безопасным способом. Это - главная слабость многих OLAP продуктов, которые имеют тенденцию предполагать, что во всех приложениях OLAP требуется только чтение, и предоставляют упрощенные средства защиты. Даже продукты с многопользовательским чтением - записью часто имеют сырые модели защиты; пример - Microsoft OLAP Services .

MULTIDIMENSIONAL (Многомерной) - ключевое требование. Если бы мы должны были определить OLAP одним словом, то выбрали бы его. Система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий, поскольку это определенно наиболее логичный способ анализировать бизнес и организации. Не устанавливается минимальное число измерений, которые должны быть обработаны, поскольку оно также зависит от приложения, и большинство продуктов OLAP обычно имеет достаточное количество измерений для тех рынков, на которые они нацелены. И опять же, в определении не фиксируется, какая основная технология базы данных должна использоваться, если пользователь получает действительно многомерное концептуальное представление информации.

INFORMATION (Информации) - это все. Необходимая информация должна быть получена там, где она необходима. Однако многое зависит от приложения. Мы измеряем мощность различных продуктов в терминах того, сколько входных данных они могут обрабатывать, но не сколько гигабайт они могут хранить. Мощность продуктов весьма различна - самые большие OLAP продукты могут оперировать по крайней мере в тысячу раз большим

11

количеством данных по сравнению с самыми маленькими. По этому поводу следует учитывать много факторов, включая дублирование данных, требуемую оперативная память, использование дискового пространства, эксплуатационные показатели, интеграцию с информационными хранилищами и т.п.

Многие профессионалы считают, что тест FASMI - разумное и понятное определение целей, на достижение которых ориентированы OLAP.

Теперь дадим краткий обзор программных продуктов, которые принадлежат описанному выше классу программных продуктов.

Обзор программных продуктов

Исторически первой многомерной системой управления базами данных, по существу являющейся OLAP-реализацией считается система Express, разработанная в 1970 году компанией IRI (позднее права на продукт были приобретены корпорацией Oracle и превращѐн в OLAP-опцию для Oracle Database). В своей публикации в журнале Computerworld в 1993

году, в качестве референтного продукта, удовлетворяющего предложенным принципам, Кодд указал систему Essbase компании Arbor (поглощѐнной в 1997 году компанией Hyperion, которую, в свою очередь, в 2007 году купила Oracle). Примечательно, что впоследствии публикация была изъята из архивов Computerworld из-за возможного конфликта интересов, так как Кодд позднее оказывал консультационные услуги для Arbor.

Среди других известных OLAP-продуктов можно назвать Microsoft Analysis Services (ранее называвшиеся OLAP Services, часть SQL Server), SAS OLAP Server, TM1, PowerPlay, SAP BW, MicroStrategy Ingelligence Server, Mondrian.

После приведенного обзора программных продуктов приведем примеры областей, где применение подобных программных продуктов оправданно.

Примеры областей применения

Продажи

Ключевые вопросы коммерсанта: "Сколько штук продано", "На какую сумму продано" расширяются по мере усложнения бизнеса и накопления исторических данных до некоторого множества факторов, или разрезов: "..в Москве, в Сибири", "..в прошлом квартале, по сравнению с нынешним", "..через магазин А, по сравнению с магазином Б".

12

Ответы на подобные вопросы необходимы для принятия управленческих решений: об изменении ассортимента, цен, закрытии и открытии магазинов, филиалов, расторжении и подписании договоров с дилерами, проведения или прекращения рекламных кампаний и т.д.

Если попытаться выделить основные цифры(факты), и разрезы(измерения) которыми манипулирует коммерсант, стараясь расширить или оптимизировать свой бизнес, то получится таблица, подходящая для анализа продаж как универсальный шаблон, требующий небольших корректив для каждого конкретного предприятия.

Интересно, что эта таблица в целом соответствует обычному счетуфактуре, то есть данные в таком виде теоретически обязаны быть у любого предприятия.

Поля таблицы: Время, Категория товара, Товар, Регион, Продавец,

Покупатель, Сумма, Количество.

Время. Как правило это несколько периодов: Год, Квартал, Месяц, Декада, Неделя, День. К счастью OLAP-инструменты автоматически вычисляют старшие периоды из даты и вычисляют итоги по ним.

Категория товара. Категорий может быть несколько, они отличаются для каждого вида бизнеса: Сорт, Модель, Вид упаковки и пр. Если продается только один товар или ассортимент очень невелик, то категория не нужна.

Товар. Иногда применятеся название товара (или услуги), иногда его код, или артикул. В тех случаях когда ассортимент очень велик (а некоторые предприятия имеют десятки тысяч позиций в своем прайс-листе), анализ по всем видам товаров может не проводиться, а обобщаться до категорий.

Регион. В зависимости от глобальности бизнеса под измерением Регион может иметься в виду Континент, Группа стран, Страна, Территория, Город, Район, Улица, Часть улицы. Конечно, если есть только одна торговая точка, это измерение отсутствует.

Продавец. Это измерение тоже зависит от структуры и масштабов бизнеса. Здесь может быть: Филиал, Магазин, Дилер, Менеджер по продажам. В некоторых случаях измерение отсутствует, например, когда продавец не влияет на объемы сбыта, магазин только один и так далее.

Покупатель. В некоторых случаях, например в розничной торговле, покупатель обезличен и измерение отсутствует, в других случаях информация о покупателе есть, и она важна для продаж. Это измерение содержать название фирмы-покупателя или множество группировок и харакетистик клиентов: Отрасль, Группа предприятий, Владелец и так далее.

13

Важный вопрос - наличие данных. Если они есть, в любом виде, как Excel-таблица, в базе данных учетной системы, в виде структурированных отчетов филиалов ИТ-специалист сможет передать их OLAP-системе напрямую или с промежуточным преобразованием. Для этого OLAP-системы имеют специальные инструменты. Если этих данных нет, или они имеют недостаточную полноту и качество, OLAP не поможет. Но сбор, очистка и хранение данных это отдельная тема.

После настройки OLAP-системы на данные, пользователь получит возможность быстро получать ответы на ключевые вопросы путем простых манипуляций мышью над OLAP-таблицей. При этом будут доступны некоторые стандартные методы анализа, следующие из природы OLAPтехнологии.

Факторный (структурный) анализ. Анализ структуры продаж для выявления важнейших составляющих в интересующем разрезе. Для этого удобно использовать диаграмму типа "Пирог", в более сложных случаях, когда иследуется сразу 3 измерения - "Столбцы". Например, в магазине "Дары моря" за квартал продажи рыбы = $100000, пива = $1000, хлеба = $500. Вывод: оборот магазина зависит только от рыбы (на самом деле быть может пиво необходимо для продажи рыбы, но это уже анализ зависимостей).

Анализ динамики. Выявление тенденций, сезонных колебаний. Наглядно динамику отображает график типа "Линия". Например, объемы продаж мойвы в течение года падали, а объемы продаж форели росли. Возможно, улучшилось благосотояние среднего покупателя, или изменился имидж магазина, а с ним и состав покупателей. Требуется провести корректировку ассортимента. Другой пример, в течение 3 лет летом снижается объем продаж пива темных сортов.

Анализ зависимостей. Сравнение объемов продаж разных товаров во времени для выявления необходимого ассортимента - "корзины". Для этого также удобно использовать график типа "Линия". Например, при удалении из ассортимента пива в течение первых двух месяцев обнаружилось падение продаж воблы.

Сопоставление (сравнительный анализ). Сравнение результатов продаж во времени, или за заданный период, или для заданной группы товаров. В зависимости от количества анализируемых факторов (от 1 до 3-х) используется диаграмма типа "Пирог" или "Столбцы". Пример, сравнение результатов продаж однотипных магазинов для оценки качества работы менеджеров.

14

Этими видами анализа возможности OLAP не исчерпываются. Например, применяя в качестве алгоритма вычисления промежуточных и окончательных итогов среднее арифметическое, или функции статистического анализа - дисперсия, среднее отклонение и т.д. можно получить самые изощренные виды аналитических отчетов.

Результаты выборов

Количество голосов поданных за кандидатов в разных разрезах на разных выборах вычисляется постоянно и непрерывно. Удивительно, но для этого практически не применяются OLAP-инструменты. Хотя любой другой способ анализа и отчетности по результатом выборов в сотни раз дороже и медленней. Не говоря уже о том, что OLAP-отчеты покажут картинку красиво, так, что ее сразу можно опубликовать на сайте, в журнале и на телевидении.

Поля таблицы: Время, Рагион, Избирательная компания, Кандидат,

Количество голосов

Избирательная компания. Название выборов и из даты, вида "Выборы в губернаторы 2000 года".

Кандидат. Избирательный блок или объединение, ФИО кандидата.

Кроме количества голосов могут вычисляться и финансовые показатели, такие как расходы на кандидатов, полученные пожертвования и взносы, средства государства, возврат средств. Творческий подход состоит в представлении фактов. Они могут находиьтся в одной колонке, т.е. это будет один факт, но с разными знаками приход и расход, тогда система будет вычислять остаток, или в разных колонках, т.е. фактов несколько.

Поля таблицы: Время, Регион, Избирательная компания, Кандидат,

Тип движения средств, Направление движения средств, Приход, Расход, Возврат, Долг

Тип движения средств. Признак Приход-Расход.

Направление движения средств. Это справочник категорий прихода - расхода (пожертвования, расходы на рекламу, и др.).

Потребление электроэнергии

Можно сказать с полной уверенностью, что задача многомерного анализа потребления электроэнергии решается со времен ГОЭЛРО. Иначе и быть не может, ведь для управления генерацией энергии, строительства

15

линий электропередач, планирования мощностей электростанций нужно знать потребности в разрезе регионов, конкретных потребителей, времени.

Следует отметить, что перечисленный список является далеко не полным и можно привести еще довольно много примеров из реальной жизни, которые иллюстрировали бы выгоду от применения продуктов категории

OLAP.

16

Заключение

Для иллюстрации полезности применения технологий при проведении анализа на предприятии смоделируем следующую ситуацию:

Представим себе, что происходит, когда аналитику необходимо получить информацию, а средства OLAP на предприятии отсутствуют. Аналитик самостоятельно (что маловероятно) или с помощью программиста делает соответствующий SQL-запрос и получает интересующие данные в виде отчета или экспортирует их в электронную таблицу. При этом возникает великое множество проблем. Во-первых, аналитик вынужден заниматься не своей работой (SQL-программированием) либо ждать, когда за него задачу выполнят программисты - все это отрицательно сказывается на производительности труда, повышаются штурмовщина, инфарктноинсультный уровень и так далее. Во-вторых, один-единственный отчет или таблица, как правило, не спасает отдел аналитики - и всю процедуру придется повторять снова и снова. В-третьих, обычно аналитики по мелочам не спрашивают - им нужно все и сразу. Это означает (хотя техника и идет вперед семимильными шагами), что сервер корпоративной реляционной СУБД, к которому обращается аналитик, может задуматься глубоко и надолго, заблокировав остальные транзакции.

В случае же, если на предприятии внедрены средства OLAP, каждый из специалистов (без сомнения, высококлассный) занимается исключительно проблемами, связанными с их непосредственными профессиональными обязанностями. Отдел аналитики перестает дергать по мелочам программистов, отчеты для проверки или создания новых гипотез аналитик получает моментально, на предприятии стоит мирная атмосфера и все трудятся на общее благо предприятия.

17