Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lekz_IITDPSU_t_1-4.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3.93 Mб
Скачать

1.5.2. Характеристика методів візуалізації

В сучасних аналітичних системах і технологіях використовується кілька десятків методів візуалізації. Вибір методу визначається особливостями і характером даних, специфікою поставлених завдань і, нарешті, уподобаннями користувачів. На наш погляд, доцільно стисло розглянути основні групи методів візуалізації, які можуть бути корисними для інформатизації податкової аналітики — візуалізація табличних і графічних даних, одновимірної і багатовимірної інформації, візуалізатори загального призначення та спеціалізовані.

Візуалізація табличних і графічних даних. Найчастіше таблиці застосовуються у тому випадку, коли користувачеві необхідно працювати з окремими значеннями даних, вносити зміни, контролювати формати даних, пропуски, протиріччя тощо. Графічні методи дозволяють краще побачити загальний характер даних — закономірності, тенденції, періодичні зміни. Крім того, графічні методи більш ефективно дозволяють зіставляти дані: достатньо побудувати графіки двох досліджуваних процесів в одній системі координат, щоб оцінити ступінь їх подібності й відмінності, а також за необхідності узагальнити.

Методи одномірної і багатомірної візуалізації. Одномірні візуалізатори представляють інформацію лише в одному вимірі даних, в той час як багатовимірні — у двох або більше. Якщо графік показує, наприклад, залежність сум надходжень податків від дати, то він буде одномірним, оскільки на ньому відображатиметься лише один вимір — Дата, значенням якого відповідатиме факт Податкові надходження. Якщо ж інформація щодо надходжень наводиться за датами та видами податків, то з’являється ще один вимір — Вид податку, і тоді для коректного представлення даних використовується багатовимірний візуалізатор. Найпопулярніші багатовимірні візуалізатори: OLAP-куб, багатовимірна діаграма, карта Кохонена, географічні і територіальні карти тощо.

Візуалізатори загального призначення та спеціалізовані. Більшість методів візуалізації загального призначення не пов’язані з якимось певним видом завдань аналізу або типом даних і можуть використовуватися на будь-якому етапі аналітичного процесу. Це свого роду типові уніфіковані візуалізатори: графіки та діаграми, графи, гістограми та їх різновиди, статистичні характеристики та ін. Водночас існує низка завдань, специфіка яких вимагає застосування спеціалізованих візуалізаторів. Наприклад, карти Кохонена, спеціально розроблені для візуалізації результатів кластеризації, матриці класифікації використовуються в основному для перевірки спроможності класифікаційних моделей, а завдяки діаграмам розсіювання оцінюється коректність роботи регресійних моделей, які можуть використовуватися в специфічних завданнях щодо прогнозування, наприклад, податкових надходжень в тому числі.

Досвід аналітичних застосувань доводить, що при вивченні різних видів візуалізації зручніше розглядати їх не окремо, а в контексті завдань, для яких вони найчастіше застосовуються. У зв’язку з цим розрізняють такі групи методів візуалізації:

  • засоби візуалізації загального призначення — застосовуються для вирішення типових завдань аналізу даних: візуальної оцінки якості та характеру даних, розподілу значень ознак, статистичних характеристик тощо;

  • засоби OLAP-аналізу —комплексу методів для візуалізації багатовимірних даних, в тому числі просторових;

  • засоби оцінки якості моделей — дають змогу оцінювати різні характеристики моделей, такі як точність, ефективність, достовірність результатів, інтерпретацію, стійкість, вартісні характеристики у тому числі;

  • засоби інтерпретації результатів аналізу — служать для представлення кінцевих результатів аналізу у вигляді, найбільш зручному з точки зору їх інтерпретації користувачами аналітичних застосувань.

Слід зазначити, що засоби і підсистеми візуалізації даних використовуються не тільки в спеціалізованих аналітичних платформах, а й практично в усіх програмних засобах, пов’язаних з обробкою даних, — від офісних додатків до систем комп’ютерної математики. Однак в аналітичних платформах візуалізації даних приділяється особлива увага, оскільки вона є однією зі складових аналітичного процесу, без якої неможливо ефективно вирішити поставлені завдання.

Практика аналітичних застосувань підтверджує, що найкращі результати можна отримати, якщо вважати візуалізацію не окремою підсистемою, а такою самою частиною аналітичного процесу, як, наприклад, моделювання, очищення та трансформація. Це дозволяє отримати максимум корисної інформації у випадках, коли застосування інших методів неефективно або очікуваного результату не досягнуто. Навіть якщо для побудови якісної моделі даних недостатньо, візуалізація дозволяє висувати гіпотези, формулювати висновки на основі експертних оцінок, розробляти способи підвищення інформативності даних чи знаходити альтернативні можливості пошуку рішень.

Характеристика візуалізаторів загального призначення. Можна виділити комплекс засобів візуалізації, що включаються до складу будь-якої аналітичної програми і застосовуються на всіх етапах оперування знаннями. Такі засоби візуалізації називаються візуалізаторами загального призначення. До них належать — графіки, діаграми, гістограми і статистика. Стислий аналіз зазначених видів візуалізації характеризує відповідно загальні можливості аналітичних технологій.

Характеристика аналітичних графіків. Графіки — це лінії, що відображають залежність між кількома змінними у відповідній системі координат. Лінія на графіку складається із множини точок, положення кожної з яких визначається значеннями залежною та незалежною змінною (змінних). Найчастіше використовується декартова система координат (X, Y, Z). Також може застосовуватися полярна система координат (z, 0), де розташування точки на координатній площині залежить від відстані до початку координат z і кута θ, можливі також інші варіанти графіків, наприклад, кругові тощо.

Відносна простота застосування перетворює графіки на ефективний засіб візуального аналізу даних, адже часто саме з побудови графіка і починається робота з даними. За допомогою графіків оцінюється ступінь згладжування даних, наявність у них шумової складової, аномальних викидів і пропусків. Особливо корисні вони при аналізі часових рядів. Іноді одного погляду на графік достатньо, щоб виявити наявність тренда, сезонної компоненти, оцінити ступінь впливу випадкової складової на досліджуваний процес, що є досить актуальним для аналізу часових рядів у податковій аналітиці або для оцінки податкових ризиків.

У процесах форматування і побудови графіків достатньо задати табличні значення залежної і незалежної змінних, зазначити відповідні точки на координатній площині і з’єднати їх лініями. Лінії, що з’єднують вузли графіка, можуть бути прямими або згладженими. На рис. 2 представлено приклади звичайного (ліворуч) і згладженого графіка (праворуч).

Рис. 2. Вигляд ламаного і згладженого графіків

Досить часто в конкретних застосуваннях згладжені графіки зручніше, ніж ламані, для візуального сприйняття і коректніше відображають реальні управлінські і бізнес-процеси, які також переважно змінюються плавно. Іноді точки, за якими будується графік, взагалі не з’єднують, в цьому випадку графік називається точковим, що досить зручно для відображення випадкових процесів.

У разі необхідності представити на графіку кілька рядів даних в одній системі координат будується кілька ліній. Але для цього необхідно, щоб усі ряди, що відображуються на графіку, мали однакові одиниці виміру і могли представлятися в одному і тому самому масштабі. Наприклад, якщо потрібно порівняти щомісячні податкові надходження за три роки, то можна скористатися графіком, який представлено на рис. 3. Подібне паралельне відображення кількох часових рідів крім зручної аналітики дозволяє досягнути одночасно і стислість інформації, що відображається. На жаль, у щорічній податковій аналітиці цей метод майже не використовується.

Рис. 3. Приклад графіка щомісячних податкових надходжень за три роки

Може виникнути ситуація, коли значення в рядах даних розташовані в різних діапазонах і відрізняються на кілька порядків, то відображення цих рядів на одному графіку може викликати певні труднощі. Припустимо, потрібно порівняти динаміку податкових надходжень для різних груп податків. Але обсяги надходжень за різними видами податків навіть в одній групі можуть відрізнятися на порядки. Подібна ситуація виникає, коли потрібно порівнювати одиничні індекси з іншими показниками, які вимірюються іншими (наприклад, масштабованими) одиницями. У цьому випадку позитивний ефект дає такий прийом, як стислість діапазону значень, що відображаються на графіку. Такий підхід може бути реалізований за допомогою логарифмування або нормалізації [12].

Засоби візуалізації на основі діаграм. З використанням графіків найзручніше відображати безперервні (числові) величини, оскільки можна отримати достатню кількість точок, щоб його побудувати. Якщо ж йдеться про категоріальні (дискретні) значення, то найбільш доречним засобом візуалізації є діаграма. Принципової різниці між поняттями графіка і діаграми немає. Просто під графіком традиційно розуміють подання залежностей у вигляді ліній, тоді як на діаграмі значення відображаються за допомогою найрізноманітніших графічних об’єктів і фігур. Як правило, на діаграмах по горизонтальній осі X відображаються категорії, а по вертикальній осі Y — їх значення чисельно.

На практиці найпростіші і найпоширеніші стовпчикові діаграми. На них значення кожної категорії зазначається у вигляді стовпчика, висота якого пропорційна відповідним значенням (рис. 4,а). Різновидом стовпчикової діаграми є лінійчата діаграма, яка відрізняється тим, що вісь категорій відображається вертикально, а вісь значень — горизонтально (рис. 4,б).

а)

б)

Рис. 4. Вигляд стовпчикової (а) і лінійчатої (б) діаграм

Наступним і також поширеним видом діаграм є кругова діаграма. Її дуже зручно використовувати, якщо потрібно показати частку, яку вносить те чи інше значення в загальну суму. Ця частка може бути виражена як в абсолютних одиницях, так і у відсотках (наприклад, відсоток податкових надходжень, який забезпечив певний вид податків). Приклад кругової діаграми розподілу місячної суми податкових надходжень за категоріями окремих податків наведено на рис. 5.

Рис. 5. Приклад кругової діаграми (у %)

Щодо аналітики — досить зручну наочність забезпечують пелюсткові діаграми. На них кожна категорія даних представлена у вигляді окремої осі (пелюстки), на якій відображається відповідне значення, і потім значення на всіх осях поєднуються лініями. Наявність на діаграмі декількох рядів дозволяє порівнювати, наприклад, динаміку зміни структури податкових надходжень для груп податків помісячно (рис. 6).

Рис. 6. Вигляд пелюсткової діаграми податкових надходжень

За формами і механізмами обчислення існує низка інших видів діаграм — діаграми з накопиченням, з областями, бульбашкоподібні, кільцеві тощо. При цьому різновид діаграми підбирається виходячи з тієї інформації, яку бажає отримати від неї користувач і яка найзручніша для сприйняття на його розсуд в контексті завдань, котрі характерні для даної предметної області.

Візуалізація на основі гістограм. Зазвичай гістограма відображає розподіл даних усередині вибірки (наприклад, суми податкових надходжень для різних груп підприємців) у вигляді стовпчиків. Гістограми широко використовуються в статистиці для визначення найімовірніших значень, які може отримати певна величина, а також для визначення закону розподілу, якому підпорядковується ця випадкова величина або стохастичний процес.

Побудову гістограми можна розглянути на прикладі. Нехай досліджуваною величиною є щомісячні податкові надходження упродовж року. При цьому мінімальне спостережуване значення становило 10 тис. грн., а максимальне — 100 тис. грн. Надалі розподіляється діапазон зміни величини на 9 піддіапазонів по 10 тис. грн. і обчислюється, скільки разів значення податкових надходжень потрапляє в той чи інший піддіапазон. Результатні дані представлені в табл. 1 у зведеному вигляді.

Таблиця 1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]