Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
база даних1.doc
Скачиваний:
5
Добавлен:
17.04.2019
Размер:
592.38 Кб
Скачать

91. Основні характеристики сховищ даних.

СД – це особлива форма організації даних, котра призначена для зберігання в узгодженому вигляді оперативної та агрегованої інформації, шо отримується на основі даних OLTP-систем та зовнішніх джерел даних.

Основні характеристики: 1 – предметна орієнтація – дані в СД орієнтовані на так звані бізнес-поняття (продажі, закупки), тоді як БД дані орієнтовані на бізнес події (документ, виписка). 2 – інтегрованість – в СД переважають не оперативні, а агреговані дані, тобто перш ніж потрапити до СД оперативні дані перевіряються, очищаються від помилок та певним чином агрегуються. 3 – підтримка хронології – дані в СД накопичуються у вигляді так званих “історичних пластів” (агреговані дані за певний період часу). 4 – незмінність – якщо для БД характерне внесення постійних змін, то дані, що зберігаються сховище у вигляді істоичних пластів, не підлягають ніяким змінам. 5 – мінімальна надлишковість – не дивлячись на те, щоінформація в СД завантажується з OLTP-систем, в них зведена до мінімуму надлишковість даних,так що в сховищі відфільтровуються лише ті дані, що необхідні для вирішення OLAP-задач.

92. Переваги сховища даних та клас задач для яких вони використовуються.

При успішній організації СД в організації можуть бути досягнути певні переваги:

Потенційно висока віддача від інвестицій - В випадку застосування даної технології організації потрібно інвестувати значні засоби для того, щоб гарантувати успішну реалізацію проекта.

Підвищення конкурентоспроможності

Підвищення конкурентоспроможності досягається за рахунок того, що особи, відповідні за прийняття рішень в даній організації, отримують доступ до раніше недоступної, невідомої і ніколи не використовуваної інформації.

Підвищення проуктивності праці осіб, відповідальних за прийняття рішень

Технологія СД підвищує продуктивність праці осіб, відповідальних за прийняття рішень в даній організації — за рахунок створення інтегрованої БД, що складається з непротирічної предметно-орієнтованої і охоплюючої обширний часовий інтервал інформації. В цій БД дані, вибрані з декількох несумісних між собою оперативних систем, інтегровані в формі, що дозволяє отримати єдине представлення про діяльність організації. СД дозволяє керівництву виконувати більш змістовний, точний аналіз діяльності підприємства.

СД містить історичні дані, дані в основному є статичними; нерегламентований, неструктурований і евристичний спосіб обробки даних; СД призначене для проведення аналіза, орієнтоване на предметні області, СД підтримує стратегічні рішення, обслуговує відносно малу кількість робітників-керівників.

93. Архітектура сховищ даних.

СД може містити такі елементи: віртуальне СД, корпоративне СД, кіоски чи вітрини даних. Віртуальне СД – це репозитарій метаданих, які описують джерела надходження інформації, структуру даних сховища, методи агарегації та заванатаження даних, відомості про структуру бізнес-понять та інщі дані про дані, що зберігаються у сховищі.

Значення метаданих в СД дуже велике, бо з метеданими працюють користувачі, тоді як в БД з ними працюють лише адміністратори. Корпоративні СД – вміщують інформацію, зібрану із певної множини оперативних БД, яка характеризує всю корпорацію і необхідна для виконання консолідованого аналізу діяльності корпорації в цілому. Такі сховища охоплюютьвсі напрямки діяльності корпорації і використовується для прийняття тактичних та стратегічних рішень. Створення КСД дуже трудомісткий процес, що вимагає 1-3 роки., а обсяги сховища більше 50 Гбайт. Кіоски чи вітрини даних – це певна підмножина корпоративних даних, які характеризують конкретний аспект діяльності корпорації, наприклад, якогось її підрозділу. Кіоск може отримувати дані з корпоративного СД (залежний кіоск) чи бути незалежним, і тоді джерелом поповнення його даними будуть оперативні БД.Розробка кіоску даних потребує значно менше часу і в середньому триває близько 2-3 місяців. Корпоративні СД та кіоски будуються заподібними принципами та використовують практично однакові технології. Останнім часом з’явилося поняття єдине джрело інтегрованих даних для всіх вітрин даних – глобальне сховище даних.

94. Характеристика багатовимірної моделі сховища даних.

Сховища повинні надавати можливість параметризації даних за різними ознаками, тобто дані мають бути представлені таким чином, щоб надавати можливість їх багатовимірного анлізу. Основи багатовимірного анілізу були започатковані Коддом в 1993р. Найбільш вдалою формою представлення даних, враховуючи параметризацію, є подання даних у вигляді багатовимірної моделі. В основу OLAP-систем покладено поняття гіперкуба, тобто багатовимірного куба, у комірках якого зберігаються необхідні для аналізу дані. Подальше ускладнення моделі даних може виконуватись у декількох напрямах:

  • збільшення числа вимірювань. Збільшення кількості вимірювань дасть N-вимірну модель;

  • ускладнення вмісту комірки. У цьому випадку в комірці буде декілька значень.

Таким чином, основними поняттями багатовимірної моделі є: вимір (Demensions), відношення вимірів та комірка (Cell), в якій зберігаються певні показники. Іноді замість терміна комірка використовується термін показник (Measure).

Показник – це поле (переважно цифрове), значення якого однозначно визначаються фіксованим набором вимірів.

Показники складають, як правило, основний вміст сховища даних.

Вимір це множина однотипних даних, що утворюють одну із граней куба і характеризують якусь ознаку показників, що знаходяться в комірці. Наприклад , день, місяць, квартал, рік –це виміри часу; район, область, країна – це географічні виміри. По виміру виконується індексація даних в багатовимірній базі даних (ББД). Сокупність вимірів визначають параметри простору, в якому можна буде виконувати бізнес-аналіз.

Відношення – це зв"язки між різними вимірами моделі, та між окремими значеннями всередині певного виміру. Між окремими значення всередині певного виміру повинна бути певна ієрархія, яка, як правило, характеризує тип відношення "один до багатьох", наприклад, населений пункт, район, область. Відношення можуть також визначати зв"язки між двома різними вимірами.

OLAP (On-Line Analytical Processing) – інтерактивна аналітична обробка. OLAP фактично означає тех-гію багатовим-го ан-зу даних. Вимоги до OLAP-с-ми розбито на 4 гр:

1) Базові х-ки: багатовимірність моделі даних; інтуїтивні х-ки маніп-ня даними; доступ-ть; пакетне отримання даних; клієнт-серверна арх-ра; прозорість д/кор-чів; багатокор-ка робота.

2) Спеціальні х-ки: обробка неформаліз-х даних; зберіг-ня рез-тів окремо від вхід. даних; виокрем-ня відсутніх даних; обробка відсутніх даних.

3) Х-ки побудови звітів: гнучкі можл-ті одер-ня звітів; стабільна прод-ть при підготовці звітів; автоматиз-ція рег-ня фіз-го рівня.

4) Керування розмірністю: заг. функц-ть, необмежене число вимірностей і рівнів агрегування; необм-ні оп-ції між даними різних рівнів.

OLAP-тех-гія дозволяє на основі багатовимірної моделі даних модел-ти реальні стр-ри і зв-ки, що є можливими д/аналітичних с-м.

Всі OLAP-с-ми побуд-ні на 2-х принципах:

1. Всі дані, необ-ні д/ПР попередньо агреговані на всіх рівнях і орг-ні так, щоб забез-ти максим-но швидкий доступ до них.

2.Мова маніп-ня даними основана на бізнес-поняттях.

В багатовимірних СУБД (БСУДБ) використовуються два основних варіанти організації даних:

Гіперкубічна модель – це модель показники якої визначатися одинаковим же наборами вимірювань.

Полікубічна модель – це модель, що підтримує декілька гіперкубів різної розмірності з різними вимірами їх граней.

Над вимірами можна проводити операції. В межах одного виміру може вводить певна ієрархія значень, так наприклад, рік складається з кварталів, квартал з місяців і т.д.

Показники, що знаходяться в комірках багатовимірної моделі можна відшукувати по будь-якому вимірюванню чи їх комбінації.