
- •Лабораторна робота № 1 Базові навики роботи в Deductor Studio 5.2.
- •1.1. Теоретичні основи роботи
- •1.2. Загальні методичні рекомендації
- •Установка Deductor.
- •Головне вікно Deductor Studio
- •Довідка про програму
- •Поняття проекту
- •Майстри
- •Базові операції над вузлами сценарію
- •Взаємодія вузлів один з одним
- •Імпорт з текстових файлів з роздільниками
- •Вузол Настройка набору даних
- •Експорт в текстовий файл
- •1.3. Порядок виконання роботи
- •1.4. Звіт про лабораторну роботу
- •1.5. Контрольні запитання
- •Лабораторна робота № 2 Базові візуалізатори. Вузли сортування, заміна і фільтрація
- •2.1. Загальні методичні рекомендації
- •Візуалізатор Статистика.
- •Візуалізатор Відомості.
- •Сортування.
- •Заміна даних
- •Фільтрація.
- •2.2. Порядок виконання роботи
- •2.3. Звіт про лабораторну роботу
- •2.4. Контрольні запитання
- •Лабораторна робота № 3
- •3.1. Загальні методичні рекомендації
- •Порядок виконання роботи
- •Звіт про лабораторну роботу
- •3.4. Контрольні запитання
- •Лабораторна робота № 4 Групова обробка. Управління розташуванням вікон.
- •Загальні методичні рекомендації
- •Порядок виконання роботи
- •Звіт про лабораторну роботу
- •Контрольні запитання
- •Лабораторна робота №5. Вирішення задач кластеризації засобами аналітичної платформи Deductor.
- •5.1. Теоретичні основи роботи
- •Загальні методичні рекомендації
- •6.1. Теоретичні основи роботи
- •Загальні методичні рекомендації
- •Порядок виконання роботи
- •7.2. Порядок виконання роботи
- •7.3. Звіт про лабораторну роботу
- •7.4. Контрольні запитання
Лабораторна робота № 1 Базові навики роботи в Deductor Studio 5.2.
Мета роботи - ознайомитися з програмним продуктом Deductor, вивчити і закріпити теоретичні, практичні аспекти програмного продукту.
1.1. Теоретичні основи роботи
Deductor -це аналітична платформа, основа для створення закінчених прикладних рішень в області аналізу даних. Реалізовані в Deductor технології дозволяють на базі єдиної архітектури пройти всі етапи побудови аналітичної системи: від консолідації даних до побудови моделей і візуалізації отриманих результатів.
До появи аналітичних платформ аналіз даних здійснювався в основному в статистичних пакетах. Їх використання вимагало високої кваліфікації користувача. Більшість алгоритмів, реалізованих в статистичних пакетах, не дозволяли ефективно обробляти великі об'єми інформації. Для автоматизації рутинних операцій доводилося використовувати вбудовані мови програмування.
В кінці 80-х рр. відбулося стрімке зростання об'ємів інформації, що накопичується на машинних носіях і зросли потреби бізнесу по застосуванню аналізу даних. Відповіддю цьому стала поява нових парадигм в аналізі: сховища даних, навчання на спеціалізованому технічному обладнанні, Data Mining, Knowlegde Discovery in Databases. Це дозволило розширити аналіз даних, вивести його на промислову основу і вирішити величезне число бізнес-задач з великим економічним ефектом.
Сприяли розвитоку аналізу даних спеціалізовані програмні системи -аналітичні платформи, які повністю автоматизували всі етапи аналізу від консолідації даних до експлуатації моделей і інтерпретації результатів.
Перша версія Deductor побачила світло в 2000р. і з того часу йде безперервний розвиток платформи. У 2007р. випущена п'ята версія системи, в 2009 р. - версія 5.2.deductor -це аналітична платформа, основа для створення закінчених прикладних рішень в області аналізу даних. Реалізовані в Deductor технології дозволяють на базі єдиної архітектури пройти всі етапи побудови аналітичної системи: від консолідації даних до побудови моделей і візуалізації отриманих результатів.
Сьогодні Deductor - це яскравий представник як настільної, так і корпоративної системи аналізу даних останнього покоління.
Аналітична платформа Deductor складається з п'яти час тин:
● Warehouse - сховище даних, що консолідує інформацію з різних джерел;
● Studio - додаток, що дозволяє пройти всі етапи побудови прикладного рішення, робоче місце аналітика;
● Viewer - робоче місце кінцевого користувача, один із засобів тиражування знань (тобто коли побудовані аналітиком моделі використовують користувачі, що не володіють технологіями аналізу даних);
● Server - служба, що забезпечує видалену аналітичну обробку даних;
● Client - клієнт доступу до Deductor Server. Забезпечує доступ до сервера із сторонніх застосувань і управління його роботою.
Існує три типи варіанту постачання платформи Deductor:
● Enterprise;
● Professional;
● Academic.
Залежно від типу постачання набір доступних компонентів може розрізнятися.
Версія Enterprise призначена для корпоративного використання. У ній присутні:
● Серверні компоненти Deductor Server і Deductor Client.
● Інтерфейс доступу до Deductor через механізм OLE Automation.
● Традиційне сховище даних Deductor Warehouse на трьох СУБД: Firebird, MS SQL, Oracle.
● Віртуальне сховище даних Deductor Virtual Warehouse.
Версія Professional призначена для невеликих компаній і однопользовательськой роботи. У ній відсутні серверні компоненти, підтримка OLE, віртуальне сховище, а традиційне сховище даних можна створювати тільки на СУБД Firebird. Автоматизація виконання сценаріїв обробки даних здійснюється тільки через пакетний режим.
Версії Professional і Enterprise вимагають установки драйверів Guardant для роботи з ліцензійним ключем.
Версія Academic призначена для освітніх і повчальних цілей. Її функціонал аналогічний версії Professional за виключенням:
► відсутній пакетний запуск сценаріїв, тобто робота в програмі може вестися тільки в інтерактивному режимі;
► відсутній імпорт з промислових джерел даних: 1С, СУБД, файли Msexcel, Deductor Data File;
► деякі інші можливості.
Категорії користувачів Deductor
В процесі розгортання і використання аналітичної платформи з нею взаємодіють різні категорії користувачів. Можна виділити чотири основні категорії:
► аналітик;
► користувач;
► адміністратор;
► програміст.
Функції аналітика:
► створення в Deductor Studio сценаріїв - послідовності кроків, яку необхідно провести для отримання потрібного результату;
► побудова, оцінка і інтерпретація моделей;
► настройка панелі звітів для користувачів Deductor Viewer;
► настроювання сценарію на поточну обробку нових даних.
Функції користувача:
► проглядання готових звітів в Dedu ctor Vi ewer.
Функції адміністратора:
► установка компонентів Deductor на робочих місцях і сервера ключів Guardant при необхідності;
► розгортання традиційного сховища даних на сервері;
► контроль процедур регулярного поповнення сховища даних;
► конфігурація сервера Deductor Server;
► настройка пакетної і/або серверної обробки сценаріїв Deductor;
► оптимізація доступу до джерел даних, зокрема до сховища даних. Функції програміста:
► інтеграція Deductor з джерелами і приймачами даних;
► виклик Deductor із зовнішніх програм різними способами, зокрема взаємодія з Deductor Server.
Така робота як проектування і наповнення сховище даних часто виконується колективно аналітиком, адміністратором і програмістом. Аналітик проектує семантичний шар сховища даних, тобто визначає, які дані необхідно зберігати в сховищі. Адміністратор створює сховище даних і наповнює його даними. Програміст при необхідності створює програмні модулі, що виконують загрузку інформації з облікових систем в проміжні джерела (так звані транспортні таблиці).