Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
DEK.doc
Скачиваний:
7
Добавлен:
10.09.2019
Размер:
1.85 Mб
Скачать

19. Візуалізатори для інтерпретації результатів аналізу.

Візуалізація – представлення даних у вигляді, що забезпечує найбільш ефективну роботу користувача.

Інтерпретація результатів аналізу – служить для передбачення кінцевих результатів аналізу у вигляді, що найбільш зручний та інформативний для розуміння користувача.

Візуалізатори:

  1. Деревовидні візуалізатори – має вигляд схематичного дерева рішень і використовується при використанні таких засобів Data Mining як: дерева рішень, асоціативні правила, кластеризація.

  2. Візуалізатори зв’язків. Суть – об’єкти представлені у вигляді певних значків, а зв’язки між ними – лініями, що з’єднують ці значки. Сила зв’язку показується товщиною ліній.

  3. Двовиміркі карти. Здійснюють візуалізацію багатовимірних об’єктів, тобто об’єктів з декількома ознаками. Карта зазвичай є сіткою. Принцип цього методу заснований на тому, що багатовимірні дані представляються у вигляді плоских карт, при побудові яких використовується комбінування інформації про відстань між векторами об’єктів в багатовимірному просторі ознак, і розфарбовування, що зумовлюється значеннями цих ознак.

20. Візуалізатори оцінки якості аналітичних моделей.

Візуалізація – представлення даних у вигляді, що забезпечує найбільш ефективну роботу користувача.

Оцінка якості аналітичних моделей – дозволяє оцінювати коректність аналітичних моделей (регресійних, класифікаційних, прогностичних), побудованих в процесі аналізу даних.

Візуалізатори:

  1. Таблиця співставлення – застосовується для оцінки якості класифікаційних моделей. Основна її суть показати скільки об’єктів кожного класу були віднесені моделлю до іншого класу невірно. Перевірка проводиться на навчальній вибірці.

  2. Діаграма розсіювання – перевіряє якість регресійних моделей. Діаграма представляє собою графік, по одній осі якого відкладаються вихідні значення, а по іншій – реальні дані. Побудувавши лінію ідеальних значень можна подивитись наскільки значення, що генерує модель відповідають реальним, і яке розсіювання вихідних значень моделі навколо ідеальної прямої.

  3. Ретропрогноз. Графік, який дозволяє перевірити коректність роботи прогностичної моделі. Суть - застосування побудованої моделі до підмножини даних з минулого,і оцінити наскільки прогноз відповідає реальним даним.

  4. Графік контролю процесу навчання. При навчанні моделі важливе значення має спостереження за зміною вихідної помилки на кожній ітерації. Тому використовуються спеціальні графіки, що дозволяють в динаміці прослідкувати стан помилки, за допомогою її середнього та максимального значення.

21. Olap-аналіз в сппр.

Візуалізатором виступає ОLAP-куб, який є досить зручним у способом аналізу багатовимірної інформації та дозволяє простим маніпулюванням мишки отримати аналітичні дані в різних розрізах.

В основі багатовимірного представлення даних лежить їх розділення на дві групи – виміри та факти. Виміри – це атрибути, найменування та властивості об’єктів, що беруть участь в певному бізнес-процесі (найменування товпрів, назви постачальників, ПІБ людей тощо). Факти – це дані, що кількісно характеризують бізнес-процес і можуть приймати нескінченну кількість значень (ціна товару, кількість, сума).

Багатовимірний куб можна розглядати як систему координат, осями якої є виміри – дата, товар, покупець. На перетину ось будуть знаходитись числові дані (напр.. сума).

Таким чином інформація в багатовимірному сховищі даних є логічно цілісною. Це не просто набори строкових числових значень, а цілісні структури типу «кому, що і скільки було продано в певний момент часу».

Представлення даних у вигляді багатовимірних кубів є більш наочним.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]