Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИАС / Лекции по ИАС.doc
Скачиваний:
220
Добавлен:
17.05.2015
Размер:
3.26 Mб
Скачать

3.4.2. Rolap

ROLAP-серверы используют реляционные БД. По словам Кодда, "реляционные

БД были, есть и будут наиболее подходящей технологией для хранения данных.

Необходимость существует не в новой технологии БД, а скорее в средствах анализа,дополняющихфункциисуществующихСУБД, идостаточногибких,чтобыпредусмотреть и автоматизировать разные виды интеллектуального анализа, присущие OLAP".

В настоящее время распространены две основные схемы реализации много-

мерного представления данных с помощью реляционных таблиц: схема «звезда» (рис.

6) и схема «снежинка» (рис. 7).

Рисунок 18. Пример схемы «звезда»

Рисунок 19. Пример схемы "снежинка"

Основнымисоставляющимисхемы"звезда"(StarSchema) являютсяденормализованная таблица фактов (Fact Table) и множество таблиц измерений(Dimension Tables).

Таблица фактов, как правило, содержит сведения об объектах или событиях,совокупность которых будет в дальнейшем анализироваться. Обычно говорят очетырех наиболее часто встречающихся типах фактов. К ним относятся:

 факты, связанные с транзакциями (Transaction facts). Они основаны наотдельныхсобытиях(типичнымипримерамикоторых являетсятелефонныйзвонок или снятие денег со счета с помощью банкомата);

 факты, связанные с "моментальными снимками" (Snapshot facts). Они ос-

нованы на состоянии объекта (например, банковского счета) в определенные моментывремени (например, на конец дня или месяца). Типичными примерами таких фактов является объем продажза день или дневная выручка;

 факты, связанные с элементами документа (Line-item facts). Они основаны

на том или ином документе (например, счете за товар или услуги) и содержатподробную информацию об элементах этого документа (например, о количестве, цене,проценте скидки);

 факты, связанные с событиями или состоянием объекта (Event or state facts).

Они представляют возникновение события без подробностей о нем (например, простофакт продажи или факт отсутствия таковой без иных подробностей).

Таблицафактов,какправило,содержитуникальныйсоставнойключ,объединяющий первичные ключи таблиц измерений. При этом как ключевые, так и

некоторые не ключевые поля должны соответствовать измерениям гиперкуба. Помимоэтого таблица фактов содержит одноили несколько числовых полей, на основании

которых вдальнейшем будут получены агрегатные данные.

Для многомерного анализа пригодны таблицы фактов, содержащие как можно

более подробные данные, т. е. соответствующие членам нижних уровней иерархиисоответствующих измерений. В таблице фактов нет никаких сведений о том, какгруппировать записи при вычислении агрегатных данных. Например, в ней естьидентификаторы продуктов или клиентов, но отсутствует информация о том, к какойкатегории относится данный продукт или в каком городе находится данный клиент. Эти сведения, используемые в дальнейшем дляпостроения иерархий в измеренияхкуба, содержатся втаблицах измерений.

Таблицы измерений содержат неизменяемые или редко изменяемые данные. В

подавляющем большинстве случаев эти данные представляют собой по одной записидля каждого члена нижнего уровня иерархии в измерении. Таблицы измерений такжесодержат как минимум одно описательное поле (обычно с именем члена измерения) и,как правило, целочисленное ключевое поле (обычно это суррогатный ключ) дляоднозначной идентификации члена измерения. Если измерение, соответствующеетаблице, содержит иерархию, то такая таблица также может содержать поля,указывающие на "родителя"данного члена в этой иерархии. Каждая таблица измеренийдолжна находиться вотношении «один-ко-многим» с таблицей фактов.

Скорость роста таблиц измерений должна быть незначительной по сравнению соскоростью роста таблицы фактов. Например, новая запись в таблицу измерений,характеризующую товары, добавляется только при появлении нового товара, непродававшегося ранее.

В сложных задачах с иерархическими измерениями имеет смысл обратиться к расширенной схеме "снежинка"(Snowflake Schema). В этих случаях отдельные таблицыфактовсоздаются длявозможных сочетаний уровней обобщения различныхизмерений (см. рис. 7). Это позволяет добиться лучшей производительности, но частоприводит к избыточности данных и к значительным усложнениям в структуре базыданных, в которой оказывается огромное количество таблиц фактов.

Увеличение числа таблиц фактов в базе данных определяется не только мно-жественностью уровней различных измерений, но и тем обстоятельством, что в общемслучае факты имеют разные множества измерений. При абстрагировании от отдельных

измерений пользователь должен получать проекцию максимально полного гиперкуба,причем далеконе всегда значения показателей в ней должны являться результатомэлементарного суммирования. Таким образом,при большом числе независимыхизмерений необходимо поддерживать множество таблиц фактов, соответствующихкаждому возможному сочетанию выбранных в запросе измерений, что также приводит к неэкономному использованию внешней памяти, увеличению времени загрузкиданных вБДсхемы«звезды»извнешнихисточников исложностямадминистрирования.

Использование реляционных БД в OLAP-системах имеет следующие досто-

инства:

 в большинстве случаев корпоративные хранилища данных реализуются

средствами реляционных СУБД, и инструменты ROLAP позволяют производить анализнепосредственно над ними. При этом размер хранилища не является таким критичнымпараметром,как в случае MOLAP;

 в случае переменной размерности задачи, когда изменения в структуру

измерений приходится вносить достаточно часто, ROLAP-системы с динамическимпредставлением размерности являются оптимальным решением, т. к. в них такиемодификации не требуют физической реорганизации БД;

 реляционные СУБД обеспечивают значительно более высокий уровень

защитыданных и хорошие возможности разграничения прав доступа.

Главный недостаток ROLAP по сравнению с многомерными СУБД – меньшая

производительность. Для обеспечения производительности, сравнимой с MOLAP, реляционные системы требуют тщательной проработки схемы базы данных инастройки индексов, т. е. больших усилий со стороны администраторов БД. Только прииспользованиисхемтипа"звезда"производительностьхорошонастроенных реляционных систем может быть приближена к производительности систем на основемногомерных баз данных.

Типичная архитектура реляционных OLAP-инструментовпредставлена на рис.

8.

Сервер

реляционной

Сервер OLAP

Уровень базыданных

SQL

Результирующий

Уровень логики

Запрос

данных

Результирующий набор

Инструментыдоступаконечных

Уровеньотображени

Рисунок 20. Типичная архитектура реляционных OLAP-инструментов

HOLAP

HOLAP-серверы используют гибридную архитектуру, которая объединяет

технологии ROLAP и MOLAP. В отличие от MOLAP, которая работает лучше, когда

данные более-менее плотные, серверы ROLAP показывают лучшие параметры в тех

случаях, когда данные сильно разрежены. Серверы HOLAP применяют подход ROLAPдля разреженных областей многомерного пространства и подход MOLAP для плотныхобластей. Серверы HOLAP разделяют запрос на несколько подзапросов, направляют их ксоответствующимфрагментамданных,комбинируют результаты, азатемпредоставляют результат пользователю.

Выводы

Из материала,изложенного вданной главе, можно сделать следующие выводы.

 Для анализа информации наиболее удобным способом ее представления является многомерная модель или гиперкуб, ребрами которого являются измерения. Это позволяет анализировать данные сразу по нескольким измерениям, т. е. выполнятьмногомерный анализ.

 Измерение –это последовательность значений одного из анализируемыхпараметров. Измерения могут представлять собой иерархическую структуру. Напересеченияхизмеренийнаходятсяданные,количественнохарактеризующиеанализируемые факты – меры.

 Над многомерной моделью – гиперкубом – могут выполняться операции:среза, вращения, консолидации и детализации. Многомерную модель и эти операции реализуют OLAP-системы

 OLAP (On-Line Analytical Processing) – технология оперативной аналити-

ческой обработки данных. Это класс приложений,предназначенных для сбора,

хранения и анализа многомерных данных вцелях поддержки принятия решений.

 Для определения OLAP-систем Кодд разработал 12 правил, позднее до-полнил к ним еще шесть и разбил 18 правил на четыре группы: основные особенности,специальныеособенности,особенностипредставленияотчетов иуправлениеизмерениями

 В 1995 г. Пендс и Крит на основании правил Кодда разработали тест FASMI,

определив OLAP как "Быстрый Анализ Разделяемой Многомерной Информации".

 Архитектура OLAP-системы включает в себя OLAP-сервер и OLAP-клиент. OLAP-серверможетбыть реализованнаосновемногомерныхБД(MOLAP), реляционных БД (ROLAP) или сочетания обеих моделей (HOLAP).

 Достоинствами MOLAP являются высокая производительность и простота

использования встроенных функций.

 Достоинствами ROLAP являютсявозможность работы с существующими

реляционными БД, более экономичное использование ресурсов и большая гибкость придобавлении новых измерений.

Лекция 4. Проектирование корпоративной информационно-аналитической системы

Средства формирования запросов и отчетов, многомерного анализа и разведкиданных повсеместно рекламируются и продвигаются сегодня, как помощники бизнеса. Однакостать таковыми они могут лишь благодаря ИТ-специалистам, понимающимосновы стратегического менеджмента на своем предприятии. В статье предлагаются рекомендациипопроектированиюкорпоративнойинформационно-аналитическойсистемы на основе построения системы сбалансированных показателей, определяющихсостав и семантику данных для разработки BI-приложений.

Потребность в средствах анализа финансовой и производственной деятельности,

оценки эффективности бизнеса, привела к распространению специальных решений,использующих комбинации технологий категории Business Intelligence, которые занесколько летпревратились вполнофункциональныеспециализированныеприложения. Появилась категория аналитических приложений, предоставляющих

средства анализа для сбыта, закупок, маркетинга, производства, управления цепочкамипоставок и управления взаимоотношениями с клиентами.

В аналитических приложениях средства BI используются для работы с данными,

характеризующимиопределенныеаспектыбизнеса,однако,чтобыпостроитьцелостнуюкартинубизнеса,напредприятияхсоздаютсякорпоративныеинформационно-аналитические системы, особую роль в которыхиграет хранилищеданных. В хранилище загружаются и обобщаются данные из различных источников,как внутренних, так и внешних для последующего комплексного анализа средствамиBI.

Подходы к созданию информационно-аналитических систем

Традиционные подходы к построению информационно-аналитическихсистемисходят из того, что в начале проекта сложно сказать, что должно быть помещено в

хранилище данных и какие аналитическиезадачи будут решаться конечнымипользователями. Например, методология Oracle DWM FT (Datawarehouse Method Fast

Track -методсозданияхранилищ"высокоскоростнаятрасса")исходитизпредположения, что разработчики на протяжении практически всего жизненного цикла

информационно-аналитической системы будут заниматься определением и анализомтребований к хранилищу данных. Основанная на DSDM (Dynamic System Development

Method - метод разработки динамических систем) эта методология реализует подход

RAD (Rapid Application Development - быстрая разработка приложений).

Согласно DSDM и Oracle DWM FT, цикл проектирования проходит черезсоздание ряда прототипов до тех пор, пока не будут удовлетворены требованияконечных пользователей. Чтобы этот цикл не стал бесконечным, разработка делится на

120-дневныевременныеотрезки(timebox),закоторые реальновыполнить

определенный, не расширяющийся набор требований (по аналогии с ящиком дляигрушек toybox, в который невозможно поместить дополнительные игрушки, невытащив уже лежащие там). Утверждается, что благодаря гибкости и простотеиспользования инструментов Business Intelligence, прототипирование не составляеттруда. Однако, такой подходоправдан для его применения ИТ-специалистами, которыестараются не слишком расширять свои познания впредметной области.

Метод RAD хорошо зарекомендовал себя при создании небольших приложений. Однако подобно тому как при создании сложных транзакционных систем уровняпредприятия возникает потребность в реинжиниринге бизнес-процессов, так присоздании корпоративных информационно-аналитических систем будет востребованбизнес-инжиниринг -созданиеорганизации,ориентированнойнавыполнениеопределенной стратегии. Хотя разработчики информационно-аналитических систем,будут продолжать итеративное проектирование по принципу "Чего изволите?", сегоднянаиболееперспективным являетсявыработкабизнес-ориентированногоподхода,основанного на BSC (Balanced Scorecard - система сбалансированных показателей).

Подход BSC с самого начала определяет бизнес-аспекты анализируемых

данных, что позволяет проектировать информационно-аналитическую систему сверху-вниз параллельно с внедрением на предприятии MBO (Management byobjectives -управление,основанноенадостижениицелей).Вместоисключительно ретроспективныхфинансовыхметрик, в хранилищахданных, созданныхна основеподхода BSC, станут учитываться "опережающие индикаторы" (leading indicator),позволяющие прогнозировать изменения вбизнесе. Такие хранилища дадут аналитикамцелостную картину развития предприятия, как минимум по четырем направлениям:

 финансовоенаправление, рассматривающееэффективностьдеятельности с точки зрения возврата инвестиций;

 маркетинговоенаправление,включающееоценкуполезноститоваров и услуг с точки зрения конечных потребителей;

 организационно-технологическоенаправление,оценивающеевнутреннюю операционную эффективность иэффективность организациибизнес-процессов;

 направление инноваций и обучения, раскрывающее способность кпостоянным улучшениям и восприятию новых идей.

Проектирование системы сбалансированных показателей

Проектированиеинформационно-аналитическихсистемнаосновеBSC

начинается с проектирования карты стратегии - ее графического описания в виде

набора причинно-следственных связей. Для каждой перспективы (финансы, маркетинг,технологии, инновации) должны быть определены стратегические цели и построенодерево целей.

Для торговойорганизации основнойстратегическойцелью можетбыть

увеличение объема реализации товаров. Это - финансовая перспектива. Достижениеэтой цели лежит в области маркетинга. Например, для достижения этой цели компанияможет выбрать два пути: расширение клиентской базы и удержание "старых" клиентов. Первое может быть достигнуто, за счет расширения географии сбыта. Для этогокомпанияможетсформулироватьорганизационнуюзадачу развитиясетипредставительств. Эта задача относится к внутренней технологии развития компании иотражает организационно-технологическую перспективу.

Клиентскаябаза может быть расширена не только за счет выхода на новые

региональные рынки, но и за счет неохваченных сегментов рынка комплексныхзаказов. Ориентациянакрупныхкомплексныхзаказчиковможетпотребоватьулучшения управления цепочками поставок, что представляет собой еще одну целевуюустановку для перспективы развития технологий. Сама посебе организация гибкихцепочек поставок невозможна без развития партнерских отношений с поставщиками,перевозчиками, кредитными и страховыми компаниями. Поиск таких партнеров и разработка цепочек представляют собой инновационную деятельность торговойорганизации, а соответствующие цели относятся к перспективе инноваций.

Росту объемов реализации способствует удержание "старых" клиентов, однакоотносительно сложно дважды продать один и тот же товар, если это товар длительногопользования, поэтому для "старых" клиентов необходимо расширение ассортимента.Торговая организация будет вести постоянный поиск, что нового можно предложить"старым" клиентам - способность гибко реагировать на потенциальный спрос являетсяодной из целей инноваций. В технологической перспективе удержание "старых"клиентов может быть поддержано за счет повышения эффективности взаимодействияподразделений компании. Если какое-то подразделение нашло клиента по своемутоварному профилю, то, возможно, и другое подразделение может также что-то емупредложить из своего ассортимента.

Таким образом, для каждой перспективы необходимо определить цели иустановить между ними причинно-следственные связи, а инструментальные средстваBSC обеспечат формирование графического образа карты стратегии.

При выборе инструментов BSC важно знать, что существует добровольнаяпрограмма их сертификации, проводимая компанией Balanced Scorecard Collaborative,

организованнаяавторамиметодологииBalancedScorecard.Сертификацияосуществляется на основе функциональных стандартов (BSC Functional Standards). К

данному моменту сертификацию прошли BSC-инструменты компаний Cognos, Crystal

Decisions, Fiber FlexSI, Hyperion, InPhase, Oracle, Peoplesoft, Pilot Software, QPR, SAP,

SAS и ряда других.

Следующий этап проектирования информационно-аналитической системы -

определение "ключевых показателей эффективности" (KPI, Key Performance Indicator),

численных характеристик выбранных целей (метрик, которые необходимо собирать вхранилище данных). По сути, эти метрики задают составданных в хранилище.

Наиболее просто оценить достижение финансовых целей, например, объема

продаж в денежном выражении. Эффективность достижения этой цели оцениваетсятакже просто путем сравнения фактических значений с целевыми. Достижение целеймаркетинга оценить несколько сложнее. Для расширения клиентской базы ключевымпоказателем можно выбрать количество новых клиентов за определенный период(месяц, год) и из сравнения этого показателя с целевым значением будет ясно,достигается ли эта цель или нет. Степень удержания "старых" клиентов можнооценивать по их доле в общем числе клиентов. Установив порог, например, в 50% дляэтого показателя,можно отслеживать, насколько велики потери "старых"клиентов.

Наиболеесложнооценитьэффективностьвнутреннихтехнологическихпроцессов компании, но и они поддаются измерению. Например, эффективностьвзаимодействияподразделенийможетбытьоцененапосреднемуколичествуподразделений,участвующих вобслуживанииодногоклиента.Развитиесетипредставительств удобно оценивать по росту количества представительств в каждом регионе. Степень улучшения управления цепочками поставок можно увидеть по такомуиндикатору, как доля сделок, вкоторых такие цепочки были использованы.

Для перспективы инноваций также должны быть определены KPI. Например,

чтобы расширение ассортимента предлагаемых товаров не сталосамоцелью, нужноотслеживать не пополнение списка наименований товаров, а долю проданных единицновых товаров. Эффективность расширения партнерских отношений также лучшеоценивать с помощью относительной величины, характеризующей долю сделок сучастием партнеров.

Следует различать KPI верхнего и нижнего уровня. В хранилище данных должна

содержаться как информация для стратегического управления, так и детальные данные,на основе которых эта информация была получена, чтобы обеспечить возможностьперехода от стратегических целей к фактическим данным, которые стоят за этимицелями.Такой переход(drill-down - спуск по данным) в информационно-аналитическойсистеме реализуется с помощью OLAP-инструментов, реализующих многомерное (иодновременно многоуровневое) представление данных.

Соседние файлы в папке ИАС