Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция_2_КИС.doc
Скачиваний:
22
Добавлен:
01.02.2015
Размер:
567.81 Кб
Скачать

Основні вимоги до даних у сховищі даних

Вимога

Засоби забезпечення

Предметна орієнтованість

Всі дані про деякий предмет (бізнес-об'єкт) збираються (з безлічі різних джерел), очищаються, узгоджуються, доповнюються, агрегуються і представляються в єдиній формі, яка є зручною для бізнес-аналізу

Інтегрованість

Всі дані про різні бізнес-об'єкти взаємно узгоджені і зберігаються в єдиному загальнокорпоративному сховищі

Незмінність

Початкові (історичні) дані після того, як вони були узгоджені, верифіковані та внесені в загальнокорпоративні сховища, залишаються незмінними і використо­вуються виключно в режимі читання

Підтримка хронології

Дані хронологічно структуровані і відобра­жують історію за достатній для виконання задач бізнес-аналізу і прогнозування період часу

Сховище даних функціонує за таким сценарієм. Згідно з заданим регламентом до нього вносять дані про об'єкт керування з різних джерел - баз даних систем оперативної обробки. Дані приводяться до єдиного формату, узгоджуються і (в ряді випадків) агрегуються до мінімально необхідного рівня узагальнення. Звичайно у сховищі підтримується хронологія даних.

Полегшеним варіантом корпоративного сховища даних є вітрини даних (Data Mart), або кіоски даних. Концепція вітрин даних була запропонована Forrester Research у 1991 р. При цьому го­ловна ідея полягала в тому, що вітрини даних містять тематичні підмножини заздалегідь агрегованих даних, за розмірами набага­то менші, ніж загальнокорпоративне сховище, та вимагають менш потужної техніки.

За формулюванням авторів вітрини даних - це множина тема­тичних баз даних, які містять інформацію, що відноситься до окре­мих аспектів діяльності організації.

Переваги концепції вітрин даних:

• аналітики бачать тільки ті дані, які їм реально потрібні;

• цільова вітрина даних максимально наближена до кінцевого користувача;

• вітрини даних містять безліч заздалегідь агрегованих даних, які простіше проектувати і настроювати;

• вітрини даних не потребують потужної обчислювальної тех­ніки.

Саме вітрини даних або щось дуже близьке до них мав на увазі Е. Кодд, коли використав термін ОLАР-Server.

Головним недоліком концепції є те, що територіальна розподі­леність ІС не дозволяє контролювати надмірність та, відповідно, цілісність БД.

Ідея поєднання СД та ВД належить М. Демаресту (М. Demarest), який у 1994 році запропонував об'єднати дві концепції та викорис­тати СД як єдине інтегроване джерело для численних вітрин даних.

Унаслідок цього з'явилася багаторівнева структура аналітич­ної системи (рис. 2.7) [23]. Таке багаторівневе рішення поступово стає стандартом де-факто, дозволяючи найбільш повно реалізува­ти та використовувати переваги кожного з підходів - компактного зберігання деталізованих даних і підтримки дуже великої БД, що забезпечується реляційними СУБД (сучасна реляційна СУБД дозволяє підтримувати терабайтні БД), простоту настроювання та хороші часи відгуку при роботі з агрегованими даними, які забез­печуються багатовимірними СУБД.

Сучасні аналітичні системи не є системами штучного інтелек­ту, вони не можуть ні допомогти, ні перешкодити в прийнятті рішен­ня. Їх метою є своєчасно забезпечити менеджера всією інформацією, необхідною для прийняття рішення.

Рис. 2.7. Багаторівнева структура аналітичної частини

інформаційної системи

Кінцеві користувачі СППР за характером діяльності можуть бути об'єднані у три основні категорії.

1. Аналітики, які повинні володіти не тільки методами дослід­ження предметної сфери, але й мати уявлення про СД, а також володіти інструментами автоматизованої розробки додатків.

2. Середня ланка керівних працівників, які використовують дані СД для підготовки рішень на рівні свого підрозділу. Ця категорія рідко використовує деталізовані дані, зосереджуючись на слабо та дуже агрегованих даних. Інструментами їх роботи є стандартні звіти, настроєні на інтерактивний режим роботи зі спеціалізовани­ми додатками.

3. Вищий ешелон керівництва використовує надто агреговані дані з основних показників, спеціалізовані додатки у вигляді інте­рактивних звітів, які відображують діяльність організації загалом для прийняття стратегічних рішень.

Розглянута концепція сховищ даних орієнтована винятково на збереження, а не на обробку корпоративних даних. Вона не визна­чає архітектуру цільових аналітичних систем, а тільки створює і шле діяльності для їх функціонування, концентруючись на вимо­гах до даних. Таким чином, вона залишає волю вибору в усьому, що стосується:

  • способів представлення даних у цільовому сховищі (наприк­лад, реляційний або багатовимірний);

  • режимів аналізу даних (статичний чи динамічний).

За критерієм режиму аналізу даних інформаційно-аналітичні системи підрозділяються на дві категорії - статичні та динамічні.

Статичні СППР, або інформаційні системи керівника (1СК) (Executive Information Systems(EIS)) - обмежені за функціональ­ністю. Вони містять у собі визначені заздалегідь запити, та не здатні відповісти на всі питання до наявних даних, які можуть виникнути при прийнятті рішень. Результатом роботи такої системи, як правило, є багатосторінкові звіти, після ретельного вивчення яких в аналітика з'являється нова серія питань. Кожний новий, непередбачений при проектуванні такої системи запит, має бути спочатку формально описаний, переданий програмісту, закодований і тільки потім виконаний. Термін очікування в такому випадку може складати години і дні, що не завжди прийнятно. Таким чином, зовнішня простота статичних СППР, за яку активно бореться більшість за­мовників інформаційно-аналітичних систем, обертається катастрофічною втратою гнучкості.

Динамічні СППР орієнтовані на обробку нерегламентованих, несподіваних (ad hoc) запитів аналітиків до даних та формування звітів довільної форми. Найбільш глибоко вимоги до таких систем розглянув Е. Кодд, поклавши початок концепції ОLАР. Робота аналітиків з цими системами полягає в інтерактивній послідовності формування запитів і вивчення їх результатів, кожний з яких може викликати потребу в новій серії запитів.

У табл. 2.3 наведена порівняльна характеристика запитів у статичній і динамічній аналі­тичній системах.

У табл. 2.4 наведені дані про використання найбільших сховищ даних фірми «Informix».

Таблиця 2.3

Порівняльна характеристика запитів при статичному та динамічному аналізі даних

Характеристика

Статичний аналіз

Динамічний аналіз

Типи питань

Скільки? Як? Коли?

Чому? Що буде, якщо ?

Час відгуку

Не регламентується

Секунди

Типові операції

Регламентований звіт, діаграма

Послідовність інтерак­тивних звітів, діаграм, екранних форм. Динамічна зміна рівнів агрегації і зрізів даних

Рівень аналітичних вимог

Середній

Високий

Тип екранних форм

В основному визначений заздалегідь, регламентований

Обумовлений користувачем

Рівень агрегації даних

Деталізовані і агреговані

В основному агреговані

Вік даних

Історичні, поточні і прогнозовані

Історичні, поточні і прогнозовані

Типи запитів

В основному передбачувані

Непередбачені, від випадку до випадку

Призначення

Регламентована аналітична обробка

Багатопрохідний аналіз, моделювання та побудова прогнозів

Таблиця 2.4

Найбільші сховища даних «Informix»

Фірма (корпорація)

Галузь

Обсяг даних

МСІ

Телекомунікації

6 Тб

Sers

Роздрібна торгівля

5 Тб

HCIA

Охорона здоров'я

З Тб

First Union

Фінанси

2-3 Тб

Fleet Bank

Фінанси

1-2 Тб

Fidelity Investments

Фінанси

800 Гб

R+V Versicherung

Страхування

500 Гб

Geico Insurance

Страхуваннях ,_

400 Гб

Le Pritemps

Роздрібна торгівля

350 Гб

American Stores

Роздрібна торгівля

300 Гб

Pepsoco

Роздрібна торгівля

300 Гб

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]