Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3154

.pdf
Скачиваний:
3
Добавлен:
15.11.2022
Размер:
3.16 Mб
Скачать

DOLAP (Desktop OLAP, настольная OLAP). Это недоро-

гой, простой в использовании OLAP-инструментарий, предназначенный для локального анализа и представления данных, которые загружаются из реляционной или многомерной БД на машину клиента. Аналитическая обработка в таких системах проводится с малыми гиперкубами, размерность их небольшая, потребности скромны, и для такой аналитической обработки достаточно ПК.

Поставщики: Cognos, Business Objects, Brio Technology, Crystal Decisions и Hummingbird.

ROLAP (Реляционные OLAP). Новые средства реляционной оперативной аналитической обработки, которые в отличие от OLAP-систем не хранят информацию в специальной многомерной БД, а позволяют использовать для этой цели стандартную реляционную СУБД со всеми ее возможностями, такими как резервное копирование и восстановление, защита данных, средства доступа и т.д.

Преимущество систем ROLAP состоит в полноте функциональных возможностей, наряду с открытостью, масштабируемостью и производительностью, которые являются отличительными чертами ведущих систем реляционных БД.

Примеры систем: Axsys компании Information Advantage, DSS/Server фирмы MicroStrategy, ProdeaBeacon Server от Prodea и MetaCube производства Informix.

Сейчас началось продвижение гибридных систем

HOLAP (Hybrid OLAP, гибридные OLAP). Разработаны с це-

лью совмещения достоинств и минимизации недостатков, присущих предыдущим классам. В случае использования гибридной архитектуры исходные данные остаются в реляционной БД, а агрегаты размещаются в многомерной БД. Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.

В последнее время конкуренция в этой области возросла. Компании Oracle и Microsoft произвели интеграцию своих БД

230

и OLAP решений и теперь используют встроенные серверы OLAP как оружие в конкурентной борьбе. Согласно послед-

ним данным аналитиков Business Intelligence Ltd (www.olapreport.com), объем рынка OLAP сегодня превышает

3миллиарда долларов и, по прогнозам, будет расти дальше.

ВРоссии и странах СНГ уже реализованы не менее 100 проектов с применением OLAP (это минимальная оценка, более вероятная цифра - 200-300 проектов). Однако информация об этом редко публикуется. Из самых известных можно назвать проекты, реализованные на АвтоВазе, РАО ЕЭС, НК Лукойле, СибНефти, Государственном Таможенном Комитете РФ, Московской Сотовой Связи.

Таблица 4.1 Главные решения OLAP и их поставщики

Решение

 

 

Поставщик

1

 

 

2

Acumate

 

 

Lucent Technologies

Aclue

 

 

Desisionism (Kana)

Analysis

 

 

TARGIT

Analyzer

 

FlintFox

AnswerSets

 

Next Action Technology

AOS

 

 

AGG

BI/Analyze

 

 

HummingBird Communication

Brio Enterprise

 

 

Brio Technology

BusinessObjects and Webintelligence

 

 

Business Objects

CFO Vision

 

SAS Institute

CLIME

 

 

Cartesis

Cristal Analysis

 

 

Holos

DB2 OLAP Server

 

IBM

DI-Driver and DI-Atlantis

 

Dimentional Insight

EAP

 

OutlookSoft

e-Planning

 

 

Adayturn Software

Essbase

 

 

Arbor Software Corporation

EURECA: Strategy

 

 

Computer Associates

Executive Viewer

 

Temtec

Express and Oracle 9i OLAP

 

 

Oracle

Info

 

Seagate

iTM 1

 

 

Applix

Hyperion MBA, OLAP

 

Hyperion Software

 

231

 

 

Продолжение таблицы 4.1

1

2

Khalix

Longview Solutions

Magnitude

Cartesis

Media

Speedware

MetaCube

Informix (IBM)

MicroStrategy 7i

MicroStrategy

MPC

Comshare

Business Objects

Business Objects

ProClarity

ProClarity

Pilot Decision Support Suite

Pilot Software

PowerPlay

Cognos

QueryObject

QueryObject Systems

Sagent

Sagent Technology

ShowCase Strategy

SPSS

Seagate Info

Crystal Decisions

SQL Server 2005 Analysis Services

Microsoft

Рассмотри более подробно наиболее известные решения. Oracle Express OLAP. Семейство базируется на сервере многомерных объектно-ориентированных баз данных Oracle Express Server, который может быть установлен на большинстве современных платформ. Express Server имеет встроенный язык манипулирования и обработки многомерных данных Express Language (4GL), который обеспечивает построение серверной логики любой сложности - от простых статистиче-

ских вычислений до имитационных моделей.

Personal Express - функционально полный вариант сервера многомерных баз, портированный на ПК. Он совместим с Express Server по объектам, хранимым в БД, что обеспечивает масштабируемость разрабатываемых систем от ПК до мейнфреймов.

Windows-приложения Express Administrator и Relational Access Administrator служат средством разработки, создания и сопровождения многомерных БД. Они поддерживают технологию графического переноса (drag & drop) для автоматической генерации подпрограмм импорта данных из реляционных БД Oracle и ODBC-источников, файлов MS Excel и текстовых

232

файлов. Приложение Express Spreadsheet Add-In позволяет использовать электронные таблицы MS Excel версии 7.0 и выше в качестве среды разработки «клиентских» OLAP-приложений.

Express Objects - профессиональная инструментальная среда для визуальной объектно-ориентированной разработки OLAP-приложений для архитектуры клиент-сервер под MS Windows. Express Objects поддерживает объектные механизмы: инкапсуляцию, наследование и полиморфизм.

Использование Web-технологий в Oracle Express делает привлекательным применение данного ПО при разработке СППР (в настоящее время данная технология поддерживается далеко не всеми OLAP-производителями). Применение Webтехнологий обеспечивает также простое решение проблемы интеграции различных платформ в информационных системах.

Внастоящее время практически для всех платформ Webбраузеры распространяются условно бесплатно. Oracle WebServer является стандартным Интернет-сервером, поддерживает протокол HTTP и обеспечивает доступ к базам данных.

Впоставку Oracle Express включены Java-аплеты, представляющие данные в графическом виде, и автоматический генератор VRML-сценариев, отображающих трехмерную графику компании Silicon Graphics.

Arbor Software Corporation - это главный соперник Oracle.

Ее продуктом является Essbase. Очень популярен сервер Arbor для различных OLAP-продуктов, что говорит о том, что многие поставщики OLAP и их продукты не обязательно выпускают полные приложения, а могут использовать в качестве базы данных Arbor (или другой продукт), и затем создавать интерфейсы к базе данных. В качестве примера можно привести

Comshare и Web-компоненту от для Arbor - CrystalInfo, выпус-

каемую Seagate Software. В последнее время Arbor заключил партнерское соглашение с IBM.

Вдополнение к таблицам Essbase Spreadsheet Add-in,

обеспечивающих пользователей возможностями OLAP в рамках их таблиц, Arbor предлагает WIRED for OLAP (средство анализа и презентаций), Crystal Info for Essbase (генератор

233

отчетов и расписаний) и SQL Drill-Through, позволяющий пользователям просматривать подробности данных в исходных реляционных базах.

Arbor не так давно выпустил Arbor Essbase Adjustment Module. Это приложение помогает пользователям в подготовке регулярно выпускаемых отчетов. Он способствует автоматизации форматирования отчетов и процессов расчета. Кроме того,

существует еще Arbor Currency Conversion Module, способный конвертировать различные валюты в национальную на основе модели для отслеживания обменных курсов.

Hyperion Software - это производитель, выпускающий исключительно OLAP-клиенты. Последним продуктом стал

Hyperion MBA, или Multidimensional Business Analyst, заменивший Hyperion OLAP.

Hyperion популярен благодаря своим дополнительным аналитическим возможностям, реализуемым в форме сложных измерений, предварительно определенных функций и отчетности. Целью его является формирование мощного финансового пакета, включающего в себя OLAP.

Hyperion предлагает два клиентских OLAP-решения. Первое, HyperionMBA, использует OLAP для бизнес-анализа. Как это обычно бывает в OLAP-приложениях, Hyperion применяет в своих решениях сложные измерения и предварительно определенные функции для расчетов и манипуляций с ва-

лютами. Программа Hyperion Analytic Accounting включает свойства OLAP в расчетные пакет.

Cognos представляет решение PowerPlay - это настольный OLAP-сервер, для извлечения данных из реляционных баз данных (Paradox, dBase, Clipper), «плоских» файлов и элек-

тронных таблиц (Microsoft Excel) используется генератор запросов и отчетов Impromptu. Затем специальный компонент, называемый Transformer, помещает извлеченные данные в клиентскую многомерную базу, которая называется PowerCube. Потребителям предоставляются широкие возможности по управлению PowerCube: передавать ее от пользователя к пользователю по запросу и принудительно, помещать

234

на сервер для разделения доступа к ней или пересылать по электронной почте. Cognos постаралась сделать свой продукт максимально открытым: во-первых, PowerCube может быть помещен в реляционные базы Oracle, Informix, Sybase, MS SQL Server на платформах UNIX, HP/UX, Sun Solaris, IBM AIX, во-

вторых, сам PowerPlay способен анализировать содержимое не только PowerCube, но и других многомерных баз данных.

Наибольшее распространение в России получили решения только двух производителей: Oracle и Microsoft. Однако Oracle направлена на использование компьютеров, не ориентированных на операционные системы Windows.

У системы Microsoft OLAP сейчас больше пользователей, чем у какой-либо другой системы OLAP на рынке вообще. Характерным признаком является высокий процент предпочтения этого решения после его первичной оценки (большинство испытателей после первичной оценки даже не пытаются проверять решения других поставщиков).

Главным фактором выбора Microsoft OLAP для клиента являются вовсе не ожидания высоких технических свойств, а невысокая цена изделия. Тем не менее, пользователи Microsoft OLAP, так же как и пользователи решений Oracle, не имеют претензий к эффективности и производительности обработки данных. Типичная база данных, с которой работает Microsoft OLAP, весьма скромна по размерам. Но показательно, что число пользователей, работающих с очень большими базами посредством Microsoft OLAP, превосходит число тех, кто работает с объектами примерных размеров посредством Essbase или

Express.

Учитывая более чем невысокую репутацию Microsoft как производителя надежных программных продуктов, примечательно то, что у пользователей OLAP особых нареканий в этом аспекте не возникает — по сравнению с откликами пользователей других решений. Какие бы ни были причины тому, но те, кто использует Microsoft OLAP, отмечают меньше технических проблем, чем пользователи какого-либо другого изделия. Это обстоятельство, в сочетании с невысокой ценой, делает

235

пользователей Microsoft OLAP наиболее лояльными к своему выбору — среди всех пользователей систем OLAP.

Среди Российских производителей инструментов класса OLAP наиболее известны Intersoft Lab, Институт Открытых Систем, BaseGroup Labs.

Решения Intersoft Lab:

-Контур Стандарт - универсальный инструмент быстрой разработки OLAP-приложений, представляющих собой пакеты аналитических интерфейсов (отчетов) для конечного пользователя: руководителя, аналитика, маркетолога и т.д. В файле приложения хранятся настройки на источники данных и метаданные: описание состава данных для анализа, измерений

ифактов, механизмов агрегации, фильтрации, сортировки данных и настройки аналитических интерфейсов, обеспечивающих визуализацию данных. Система относится к классу OLAP-клиент. Исполнение приложений обеспечивается встроенной OLAP-машиной собственной разработки компании

Intersoft Lab.

-Контур OLAPBrowser - специализированный многооконный броузер для выполнения OLAP-анализа в Internet, локальной сети, на персональном компьютере и обычной работы в Internet. Система обеспечивает просмотр и OLAP-анализ данных, опубликованных в виде Контур-микрокубов на Webсайте или сетевом диске. Контур-микрокуб - это витрина данных (MOLAP), в которую с помощью специального генератора загружены данные из произвольных источников, например, бухгалтерской системы, хранилища данных и др.

Решение Института Открытых Систем при Ивановском Городском Энергетическом Университете: ИнфоВизор - комплекс инструментальных средств для автоматизированной поддержки принятия решений.

Решение BaseGroup Labs: Cube Analyzer - система анализа информации на базе технологии OLAP. Является составной частью пакета Deductor. Представляет собой продукт класса Desktop OLAP.

236

4.6. Интеллектуальный анализ данных Data Mining

Интеллектуальный анализ данных (ИАД, DM - Data Mining, KDD - Knowledge Discovery in Databases) — это про-

цесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Эти исследования включают в себя: поиск зависимостей между данными; выявление устойчивых бизнес-групп; прогнозирование поведения бизнес-показателей; оценка влияния решений на бизнес компании; поиск аномалий. При этом накопленные сведения автоматически обобщаются до информации, которая может быть охарактеризована как знания.

Важное отличие DM от OLTP методов оперативного анализа, используемых в существующих транзакционных системах обработки данных (СОД), состоит в переходе от технологии визуализации текущих ситуаций к фундаментальным методам исследований, опирающимся на мощный аппарат современной прикладной математики.

Основными задачами DM в управлении производственными процессами являются комплексный системный анализ производственных ситуаций, краткосрочный и долгосрочный прогноз их развития и выработка вариантов оптимизационных решений. Анализ производственных (или технологических) ситуаций включает в себя:

обнаружение и прогнозирование скрытых тенденций и закономерностей развития производственных процессов:

обнаружение и распознавание скрытых факторов влияния (в том числе, факторов угрозы);

обнаружение и идентификацию ранее неизвестных взаимосвязей между производственными параметрами и факторами влияния:

анализ среды взаимодействия производственных процессов и прогнозирование изменения ее характеристик;

выработку оптимизационных рекомендаций по управлению производственными процессами;

237

визуализацию результатов анализа, подготовку предварительных отчетов и проектов допустимых решений с оценками достоверности и эффективности возможных реализаций.

4.6.1. Стадии процесса ИАД

В общем случае процесс интеллектуального анализа данных состоит из трёх стадий:

 

 

 

Использование выявленных

 

 

Анализ исключений,

Выявление

 

 

закономерностей для

 

 

предназначенный для

 

 

предсказания неизвестных

 

 

выявления и толкования

закономерностей

 

 

 

 

 

 

значений (прогностическое

 

 

аномалий в найденных

 

 

 

моделирование)

 

 

закономерностях

 

 

 

 

 

 

 

Рис. 4.7. Стадии ИАД

Интеллектуальные системы компьютерного анализа данных могут основываться на двух подходах. Первый заключается в том, что в системе фиксируется опыт эксперта, который и используется для оценки создавшейся ситуации. На этом подходе основывается построение экспертных систем.

Второй подход базируется на анализе исторических данных, описывающих поведение изучаемого объекта, принятых в прошлом решениях, их результатах (например, анализе временных рядов стоимости акций, статистики продаж и т.п.).

Наконец, существует третий подход – комбинация первых двух: результаты, полученные при анализе исторических данных, оцениваются на основе опыта эксперта.

В последнее время резко возрос интерес ко второму и третьему подходам. Это объясняется тем, что в связи с резким усложнением управленческих задач возникли новые потребности в глубоком анализе поступающей и хранящейся в базах данных информации, выполняемой в реальном масштабе времени.

Технологии, используемые в Data Mining, можно условно разделить на статистические методы, основанные на использовании усредненного накопленного опыта, отраженного

238

в массивах ретроспективных данных, и кибернетические методы, охватывающие множество разнородных математических подходов, основанных на использовании технологий искусственных нейронных сетей, ассоциативной памяти, нечеткой логики и т.п. (рис. 4.8).

Рис. 4.8. Математический инструментарий Data Mining

В качестве важнейшего направления развития средств DM следует выделить мощный арсенал статистических методов обработки данных. В соответствии с классификационной традицией, их удобно разделить на четыре взаимосвязанных раздела:

предварительный анализ природы статистических данных (проверка гипотез стационарности, нормальности, независимости, однородности, оценка вида функции распределения, ее параметров и т.п.);

выявление связей и закономерностей (линейный и нелинейный регрессионный анализ, корреляционный анализ и др.);

многомерный статистический анализ (линейный и нелинейный дискриминантный анализ, кластер-анализ, компонентный анализ, факторный анализ и др.);

239

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]