Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информационные системы и технологии

.pdf
Скачиваний:
286
Добавлен:
23.03.2015
Размер:
2.08 Mб
Скачать

Технологии интегрированных информационныхсистем общего назначения

Измерениями являются год, страна, поставщик, агрега- том суммарная стоимость заказов.

Если учесть, что в каждой стране может существовать не- сколько клиентов, то добавляется четвертое измерение. Неко- торым аналитикам может потребоваться до 20 измерений.

Многомерный куб сам по себе для анализа не пригоден. Для использования из многомерного куба извлекают обычные двумерные таблицы. Эта операция называется «разрезанием» куба. При этом куб можно разрезать по разным измерениям, получая разные срезы (сечения) – разные таблицы. Агрегат- ные данные берутся из нижних уровней иерархии, а затем суммируются для получения значений более высоких уров- ней. Для того чтобы ускорить процесс перехода, просуммиро- ванные значения для разных уровней хранятся в кубе. Таким образом, то, что пользователю кажется кубом, грубо говоря, состоит из множества более примитивных кубов. Например, если данные содержали информацию о дневной выручке по конкретному товару в одном магазине, то при формировании куба OLAP-приложение считает итоговые суммы для разных уровней иерархий (недель, месяцев, одного магазина, магази- нов города, страны). Это повышает скорость доступа к анали- тическим данным, но увеличивает объем памяти для хранения.

Как исходные, так и агрегатные данные могут храниться либо в реляционных, либо в многомерных базах данных MDD (MultiDimensional Data).

Многомерный анализ данных может быть произведен посредством клиентских приложений и серверных OLAP- систем.

Клиентские приложения, содержащие OLAP-средства,

позволяют вычислять агрегатные данные. Агрегатные данные размещаются в кэш внутри адресного пространства такого OLAP-средства. Кэш быстродействующий буфер большой емкости, работающий по специальному алгоритму. При этом, если исходные данные находятся в реляционной базе, вычис- ления производятся OLAP-средствами клиентского приложе- ния. Если исходные данные размещаются на сервере баз дан-

301

Информационные технологии

ных, то OLAP-средства приложений посылают SQL-запросы на сервер баз данных и получают агрегатные данные, вычис- ленные сервером.

Примерами клиентских приложений, содержащими OLAP-средства, являются приложения статистической обра-

ботки данных SEWSS (Statistic Enterprise – Wide SPS System) фирмы StatSoft и MS Excel 2000. Excel позволяет создать и со-

хранить небольшой локальный многомерный OLAP-куб и отобразить его двух- или трехмерные сечения (разреза).

Многие средства проектирования позволяют создавать простейшие OLAP-средства. Например, Borland Delphi и Borland C++ Builder.

Отметим, что клиентские приложения применяются при малом числе измерений (не более шести) и небольшом разно- образии значений этих измерений.

Серверные OLAP-системы развили идею сохранения кэш с агрегатными данными.

Вних сохранение и изменение агрегатных данных, под- держка содержащего их хранилища осуществляется отдель- ным приложением (процессом), называемым OLAP-сервером. Клиентские приложения делают запросы к OLAP-серверу и получают требуемые агрегатные данные. Серверные OLAP- системы рассчитаны на любое количество измерений.

Применение OLAP-серверов сокращает трафик сети, время обслуживания запросов, сокращает требования к ресур- сам клиентских приложений.

Вмасштабе предприятия обычно используются OLAP-

серверы типа Oracle Express Server, MS SQL Server 2000 Analysis Services и др.

Заметим, что MS Excel 2000 позволяет делать запросы к OLAP-серверам.

Серверные OLAP-системы на базе информационных хранилищ поддерживают все три способы хранения данных.

Аналитическая система обеспечивает выдачу агрегатных данных по запросам клиентов. Сложность аналитических сис-

302

Технологии интегрированных информационныхсистем общего назначения

тем вызвана реализацией сложных интеллектуальных запро- сов. Интеллектуальные запросы осуществляют поиск по ус- ловию или алгоритму вычисления ответа. Например, выбрать для выпуска изделия, приносящие максимальную прибыль. Само условие может доопределяться в ходе формирования ответа, что усложняет алгоритм формирования ответа. Дан- ные для формирования ответа могут находиться в разных внутренних и внешних базах. Существующий язык запросов SQL расширяется возможностью построения интеллектуальных запросов. Пример такого запроса сравнить данные о прода- жах в конкретные месяцы, но разные годы. Для таких запросов используются непроцедурные языки обращения к многомер- ным базам данных. Примером такого языка запросов является язык MDX (Multidimensional Expressions). Он позволяет фор-

мировать запрос и описывать алгоритм вычислений. Язык SQL используется для извлечения данных из локальных баз. Язык MDX служит для извлечения данных из многомерных баз и информационных хранилищ.

Аналитические данные используются в системах под- держки принятия решений.

Самые современные аналитические системы основыва- ются на информационных хранилищах и обеспечивают весь спектр аналитической обработки. Доступ к информационным хранилищам реализован посредством транзакций. По интел- лектуальным запросам OLAP-системы информационное хра- нилище выдает аналитические данные. По запросам, объеди- ненным в транзакции других систем, информационное хра- нилище обеспечивает их обработку, выдачу ответов и отчетов, но не обеспечивает функцию анализа данных. Именно поэто- му эти системы называются OLTP-системами (On-Line Transaction Processing) в отличие от OLAP-систем.

Примером OLAP-систем является Brio Query Enterprise

корпорации Brio Technology. OLAP-средства включают в свои системы фирмы 1С, Парус и др.

Технологии Data Mining (добыча данных) разработаны для поиска и выявления в данных скрытых связей и взаимоза-

303

Информационные технологии

висимостей с целью предоставления их руководителю в про- цессе принятия решений. Для этого используются статистиче- ские методы корреляции, оптимизации и методы, позволяю- щие находить эти зависимости и синтезировать дедуктивную (обобщающую) информацию. Технологии Data Mining обеспечивают:

поиск зависимых данных (реализацию интеллектуальных запросов);

выявление устойчивых бизнес-групп (выявление групп объектов, близких по заданным критериям);

ранжирование важности измерений при классификации объектов для проведения анализа (страна, город, район, поставщик);

прогнозирование бизнес-показателей (например, ожидае- мые продажи, спрос);

оценка влияния принимаемых решений на достижение ус- пеха предприятия;

поиск аномалий и т.д.

Технологии Data Mining позволяют наблюдать за теку- щей информацией с целью поиска отклонений, тенденций без вникания в смысл самих данных. Их используют, например, для оценки поведения покупателей, чтобы внести изменения рекламную тактику, для корректировки выпуска продукции, изменения ценовой политики и т.д.

Интеллектуальные деловые технологии BIS (Business Intelligence Services) преобразуют информацию из внутренних и внешних баз в интеллектуальный капитал (аналитические данные). Главными задачами систем интеллектуального вы- бора данных является поиск функциональных и логических закономерностей в накопленных данных для подсказки обос- нованных управленческих решений. Они основаны на при- менении технологий информационного хранилища и алго- ритмов автоматизации деловых процессов (Workflow). Анали- тические данные предоставляются руководству всех уровней и работникам аналитических служб организации по запросам в удобном виде.

304

Технологии интегрированных информационныхсистем общего назначения

Для интеллектуального анализа текстовой информа- ции разработаны структурные аналитические технологии

(САТ). Они ориентированы на углубленную обработку не- структурированной информации. Реализуют уникальную способность человека интерпретировать (толковать) содержа- ние текстовой информации и устанавливать связи между фрагментами текста. САТ реализованы на базе гипертексто- вой технологии, лингвистических процессоров, семантиче- ских сетей. Гипертекстовая технология используется для по- строения смысловаых связей между фрагментами текста, лин- гвистические процессоры и семантические сети для анализа смысловых фрагментов.

Структурные аналитические технологии предназначены для решения разнообразных задач аналитического характера на основе структуризации предварительно отобранной тек- стовой информации. Являются инструментом создания ана- литических докладов, отчетов, статей, заметок для использо- вания в информационно-аналитических службах организа- ций, отраслей, государственного управления, СМИ и т.д.

8.9. Технологии поддержки принятия решений

До появления аналитических систем предпринимались попытки создания автоматизированных систем управления (АСУ) на основе анализа данных локальных баз предприятия. Однако реализованные функции значительно отличались от функций ведения бизнеса, так как данные, собранные в ло- кальных базах, не адекватны информации, которая нужна лицам, принимающим решения.

Отличие систем поддержки принятия решений (СППР) от автоматизированных систем управления заключается в следующем:

автоматизированные системы управления основаны на локальных базах данных. СППР на информационных хранилищах, витринах данных;

305

Информационные технологии

автоматизированные системы управления используют только внутренние данные. СППР используют внутренние и внешние данные;

в автоматизированных системах управления использует- ся одна модель данных чаще всего реляционная. В СППР применяются разные модели данных: витрин, ре- ляционных и многомерных баз данных;

обе системы различаются архитектурой хранения дан- ных;

автоматизированные системы управления обслуживают запросы, СППРобеспечиваютинтеллектуальные запросы;

в отличие от автоматизированных систем управления СППР обеспечивает интеллектуальную поддержку при- нятия решений.

АСУ состояли из подсистем. Часть подсистем в настоя-

щее время реализуется корпоративными информационными системами. К управляющим подсистемам АСУ относились Исполнительные Информационные Системы и Управленче- ские Информационные Системы. Исполнительная Информа-

ционная Система(EIS – Execution Information System) реализо-

вывала функции контроля исполнения документов (приказов, писем, инструкций и т.д.)

Автоматизация деловых процессов, применяемая в сис- темах электронного документооборота и групповой работы, автоматически обеспечила контроль исполнения деловых операций на уровне каждого сотрудника предприятия. Тем самым надобность в исполнительных информационных сис- темах EIS отпала.

Управленческие системы (MIS – Management Information System) реализовывали различные функции управленческого персонала. Они зависели от уровня управления, поставлен- ных целей, типа предприятия, циркулирующих регламент- ных документов и т.д. Они разрабатывались на базе обработ- ки детализированных данных предприятия как АРМ руково- дителей всех уровней. Появление аналитических систем и технологий интеллектуального выбора данных позволило

306

Технологии интегрированных информационныхсистем общего назначения

создать интеллектуальные системы поддержки принятия ре- шений (DSS). Эти системы автоматически реализовали функ- ции АРМ руководителей всех уровней и предоставили руко- водителям всех уровней инструмент, помогающий им прини- мать обоснованные решения.

Системы поддержки принятия решений DSS (Decision Support System) на базе аналитических данных подсказывают или помогают выбрать руководящему персоналу обоснован- ное решение, приносящее успех предприятию. Они предна- значены для:

анализа аналитических данных для оценки сложившей- ся ситуации при выработке решения;

выявления ограничений на принимаемое решение, про- тиворечивых требований, формируемых внутренней и внешней средой;

генерации списка возможных решений (альтернатив);

оценки альтернатив с учетом ограничений и противоре- чивых требований для выбора решения;

анализа последствий принимаемого решения;

окончательного выбора решения. Специфика этих задач заключается в том, что:

решения надо принимать быстро, т.е. нет времени на долгий анализ данных;

решения принимаются по неполной, нечеткой, недосто- верной информации.

Эти неопределенности получили название «не фактор».

Азадачи, учитывающие их, относятся к классу слабо структу- рированных и неструктурированных задач, где невозможно без вмешательства человека дать четкие алгоритмы зависимо- стей между данными. В этих задачах количественные или ка- чественные зависимости показателей либо неизвестны, либо заранее не определены. В хорошо структурированных задачах можно найти алгоритм построения количественных или каче- ственных зависимостей, что упрощает их автоматизацию.

307

Информационные технологии

Решение слабо структурированных задач основано на использовании экономико-математических моделей, методов экспертных оценок, много проходного анализа данных. Для описания зависимостей между данными используются модели на основе таблиц решений, приближенных множеств, обучающих систем, правдоподобного вывода, когнитивные модели, логико-лингвистические модели, эволюционные ал- горитмы, алгоритмы распознавания и др.

Пользователями систем поддержки принятия решений являются руководители высших уровней управления пред- приятием и менеджеры аналитических служб.

Отличие систем поддержки принятия решений от ана- литических систем заключается в следующем. Аналитические системы подготавливают аналитическую информацию. Руко- водитель может на ее основе принять решение. Системы под- держки принятия решений проводят дальнейший анализ аналитической информации для выработки подсказки, списка решений или единственного обоснованного решения. Анали- тические данные могут содержать десятки тысяч подсказок, за- висимостей, закономерностей часто противоречивых. Поэтому для выработки меньшего числа решений применяются сложные технологии, базирующиеся на алгоритмах интеллектуальных систем, динамических моделей, методов правдоподобного по- иска решений, алгоритмах нелогичной логики, которая включа- ет логику веры, умолчания и т.д. В СППР используются тех- нологии информационных хранилищ, гипертекстовая техно- логия, технологии когнитивной графики.

Алгоритм выработки решения заключается в следую- щем. На базе аналитических данных выбирается одна из мо- делей поиска решений. Если она (модель) не дает подсказки для выбора решения, то либо модифицируется данная мо- дель, либо выбирается другая. Такие действия продолжаются до тех пор, пока не будет предложен приемлемый список под- сказок для принятия решения. Заметим, что поиск решений ведется не только по внутренним данным, ведется сравнение с данными, полученными из внешних источников.

308

Технологии интегрированных информационныхсистем общего назначения

Использование когнитивной графики позволяет как бы заменить эксперта на полиэкране (многооконный экран) вы- водятся текстовые сообщения о состоянии исследуемой облас- ти, графики зависимостей, нечеткие шкалы, позволяющие определить, где возникла критическая ситуация. Цветом изо- бражается характер ситуации (желтый, красный, зеленый). Например, желтый цвет графика показывает, что заканчива- ются комплектующие изделия. Красный указывает, что по- ставщик задерживает поставку. Зеленый обозначает, что все в порядке. Руководитель сразу видит ситуацию, где надо при- нимать решение.

Для реализации функций СППР разработаны серверы DSS. В настоящее время эксплуатируются четыре варианта архитектур СППР:

функциональные СППР на основе внутренних локаль- ных баз данных (для переходного периода);

на базе независимых витрин данных, информация кото- рых не дублируется (в небольших организациях);

на базе двухуровневой структуры информационного хранилища;

на базе трехуровневой структуры информационного хранилища.

Рассмотрим, как обеспечивается поддержка основных

функций управления. Система управления предприятием может быть разделена на управляющую и управляемую под- системы. Управляющая подсистема занимается выработкой управляющих решений. Именно она и предназначена руко- водителям всех уровней. СППР как раз и обеспечивает выпол- нение ее функций. Управляющая подсистема работает с ана- литическими данными. Управляемая подсистема является исполнителем решений. К управляемым подсистемам отно- сятся бухгалтерский учет, финансовый анализ, управление кадрами и другие подсистемы КИС. Управляемая подсистема обслуживает исполнителей заданий. Ранее эти функции вы- полняли АРМ информационных сотрудников.

309

Информационные технологии

Важным показателем эффективности взаимодействия управляющей и управляемой подсистем является обратная связь. Обратная связь это информация о результатах управ- ленческого воздействия. Управляющая подсистема получает ее от управляемой в виде разнообразных отчетов (бухгалтер- ских, финансовых, поставки, продажи). Такая информация помогает оценить полученные результаты и служит основой для выработки новых решений.

Заметим, что управляемая подсистема формирует отче- ты посредством транзакций к информационному хранилищу (технологии OLTP). Управляющая подсистема формирует решения на основе интеллектуальных запросов аналитиче- ской информации к информационным хранилищам (техно- логии OLAP). Технологии автоматизации деловых процессов (workflow) обеспечивают реализацию обратной связи, т.е. они обеспечивают взаимодействие управляющей и управляемых подсистем.

Большинство деловых процессов обладает следующими характеристиками:

деловой процесс (бизнес-процесс) состоит из конечного числа действий, выполняемых последовательно;

в деловой процесс вовлечены сотрудники с различной степенью ответственности;

деловые процессы заключаются в изучении, создании, обработке, передаче информации в разных формах представления;

деловой процесс имеет цель, которая известна не всем сотрудникам.

Системы автоматизации деловых процессов поддержи-

вают реализацию всех основных функций управляющей под- системы: планирование, организация, активизация, коорди- нация и контроль.

Планирование выполняется для того, чтобы построить план действий, распределить задания между сотрудниками. Для его активизации руководство формулирует поручения и распо- ряжения, призванные реализовать сформированный план. По-

310