
- •Семіотика і креатив
- •Розділ 1. Семіотика систем управління
- •1.1 Таксономічний підхід, мова і семіотика
- •1.2 Синтаксис, семантика, прагматика
- •Розділ 2. Бачення і візуалізація
- •2.1 Візуальні уявлення
- •2.2 Створення візуальних уявлень
- •2.3 Мережі і ієрархії
- •Розділ 3. Креативність і форсайт
- •3.1 Ідея творчого потенціалу і креативності
- •3.2 Уява і форсайт
- •3.3 Уява і креативні можливості
- •3.4 Стратегічне бачення і креативність
- •3.5 Розкриття сигнальних карт
- •3.6 Стратегічна креативність і творчий потенціал
- •Відкриття сигналу: збір і аналіз даних, визначення тактичних агентів
- •3.7 Метод простору даних
- •Розділ 4. Відкриті інновації
- •4.1 Непередбачені можливості
- •4.2 Побудова процесу інновації
- •4.3 Просування інновації
- •4.4 Інновація 2.0
- •4.5 Вимірювання технології в інноваціях
- •4.6 Виклики глобалізації для національної економіки
- •Розділ 5. Інструменти креативного мислення
- •5.1 Креативна культура і творче мислення
- •5.2 Особисті і групові методи генерації ідей і вирішення проблем
- •3D морфологія
- •Література
2.2 Створення візуальних уявлень
У цьому розділі більш детально розглядається процес виробництва зразка візуального уявлення, який створює візуальне уявлення з певного числа даних, використовуючи певні комп'ютерні процеси. Не розглядаючи подробиці технічних деталей, мі опишемо цей процес через модель, яку ми використовуватимемо як посилання для інтерактивного візуального уявлення. Крім того, ми розглянемо кілька загальних методів для того, щоб візуалізувати лінійні структури даних.
Еталонна модель
Варто припустити, що у нашому розпорядженні є колекція даних, на яких ми хотіли б виконати дослідницький аналіз, щоб ідентифікувати будь-які можливі невідомі тенденції або відносини. Як ми можемо досягти утворюючого візуального уявлення від цих даних? Як завжди, добрий задум проекту ключ до успіху в такому бажанні. Перш, ніж зайнятися цим тонким і надзвичайно важливим аспектом, ми визначимо, який інструмент інформаційної технології є в нашому розпорядженні, щоб глибше зрозуміти візуальні уявлення.
Комп'ютери можуть дуже допомогти , якщо ми не хочемо робити спробу проектування на порожньому місці. Є багато варіантів програмного забезпечення візуалізації, що може надати нам повний перелік візуальних шаблонів. Але як ці програми працюють?
Програмне забезпечення присвячено створенню візуального представлення абстрактних даних, навіть якщо вони дуже різняться між собою. Розглянемо початкові дані як нашу відправну позицію, або швидкі абстрактні дані, забезпечені світом навколо нас рис 2.7 В попередньому розділі було розглянуто абстрактні дані, де підкреслювалось, що у цих даних не обов'язково є певний зв'язок з фізичним об'єктом. Наприклад, можна мати справу з іменами людей, цінами на продукти, голоси за результати, і так далі. Ці дані рідко доступні у форматі, який є відповідним для обробки автоматичними інструментами і, має необхідність програмного забезпечення для візулізації. Тому, вони повинні бути попередньо оброблені перед графічним поданням.
Рис 2.7 Процес візуалізації.
Створення процесу візуалізації можна моделювати через послідовність таких стадій:
попередня обробка і перетворення даних.
візуальна картографія.
створення уявлення.
Ми опишемо кожну з цих стадій на прикладах, показуючи, як дані перетворюються з оригінального формату до візуальної репрезентації.
Попередня обробка і перетворення даних
Ми використовуємо термін сировина, щоб описати дані, отримані з світу навкруги нас. Вони можуть бути даними, наданими приладами вони можуть бути також надані і обчислені відповідним програмним забезпеченням, таким як дані прогнозу погоди.
Вони можуть навіть бути даними, пов'язаними з вимірними подіями і юридичними особами, які ми знаходимо в природі або соціальному світі, як число жителів або коефіцієнти народжуваності у містах в певній державі. В кожному випадку ці колекції даних, відомі як набори даних дуже рідко поставляються нам з точною логічною структурою. Щоб бути в змозі обробити ці дані, використовуючи програмне забезпечення, ми повинні дати їм організовану логічну структуру. Структура, що звичайно використовується для цього типу даних, є табличною у форматі, відповідному для програмного забезпечення, яка повинна отримати і обробити їх. Іноді вхідні дані містяться в одній або більше базах даних і, тому, вже доступні в електронному форматі із чіткою структурою. В цьому випадку, початкові дані відповідають даним, розташованим в базах даних, і фази попередньої обробки і розробки залучають витягання цих даних з бази даних і перетворення їх в структурований формат, що використовується програмним забезпеченням візуалізації.
Такий файл буде джерелом низки даних в нашій системі. Фаза попередньої обробки повинна перетворити ці дані в табличний формат. Структури даних також можуть бути збагачені додатковою інформацією. Зокрема, фільтруючи операції, щоб усунути непотрібні дані і обчислення для того, щоб одержати нові дані, такі як статистика, яка може буде представлена у візуальній версії.
Візуальна картографія
Ключові проблеми цього процесу лежать у визначенні які візуальні структури використовувати, щоб нанести на карту дані і їх місцеположення в області показу. У абстрактних даних не обов'язково є реальне місцеположення у фізичному місці. Є деякі типи абстрактних даних, які, по їх самій природі, можуть легко знайти просторове місцеположення. Наприклад, дані, узяті від контролюючої станції для атмосферного забруднення, можуть легко знайти положення на географічній карті, за умови, що контролюючі станції, які проводять вимірювання, розташовані в точному пункті на території. Те ж саме стосується даних, узятих від юридичних осіб, у яких є власна топологічна структура, така як транспортні дані комп'ютерної мережі. Проте, є декілька типів даних, які належать юридичним особам, у яких немає ніякого природного географічного або топологічного розташування. Наприклад, число бібліографічних посилань в наукових текстах, споживання автомобільного палива, або зарплати різних професійних груп в межах компанії. У цього типу даних немає безпосередньої кореспонденції з вимірюванням фізичного місця, які оточують його. Ми повинні визначити візуальні структури, які відповідають тим даним, які ми хочемо представити візуально. Цей процес називають візуальною картографією. Мають бути визначені три структури:
1. просторова підстава.
2. графічні елементи.
3. графічні властивості.
Просторова підстава визначає вимірювання у фізичному місці, де візуальне уявлення створене. Просторова підстава може бути визначена з погляду координат. У декартовій системі просторова підстава відповідає x і у вісям. Кожна вісь може мати різні типи, типу даних, які ми хочемо нанести на карту. Зокрема вісь може бути кількісною, коли є метрика, пов'язана з цінностями; або - порядковою, коли про цінності не повідомляють
З погляду візуального сприйняття людини не всі графічні властивості поводяться таким же чином. Деякі графічні властивості більш ефективні ніж інші для представлення кількісних цінностей. Клівленд і Макджілл виконали дослідження і оцінили точність, з якою люди в змозі відчувати кількісні цінності, нанесені на карту до різних властивостей, графічних елементів, і просторових підстав.
Колір повинен бути підібраний з особливою увагою. Фактично, колір - єдина графічна властивість, в якій сприйняття може залежати від культурних, лінгвістичних, і фізіологічних чинників. Деякі співтовариства, наприклад, використовують обмежене число слів, щоб визначити весь кольоровий спектр (в деяких поселеннях, є тільки два слова, щоб описати кольори: чорний і білий). Тому можливо, що люди з різних культур можуть використовувати різноманітну термінологію, щоб ідентифікувати той же самий колір або можуть навіть мати різне сприйняття, за умови, що у них не могло бути певного терміну для того, щоб ідентифікувати важливий колір на пізнавальному рівні. У дослідженні сприйняття є така демонстрація представлення, що, навіть беручи до уваги культурні відмінності, існують кольори, які можна вважати первинними, білий, чорний, червоний, зелений, жовтий, і синій. Вони єдині кольори, які мають однаковий зміст і назву у всьому світі і, є кольорами, які повинні бути вибраними., коли необхідно нанести на карту ознаку категорії з максимуму шести кольорів. Колін пропонує обмежити будь-яку картографію категоричних ознак до цих шести первинних кольорів, але, у разі потреби, можливо розширити список, додаючи рожевий, коричневий, блакитний, помаранчовий, і фіолетовий. Щоб представити кількісні ознаки, або де є замовлення цінностей, використовування первинних кольорів не бажано, тому що (1) не могло б бути достатньо багатьох первинних кольорів, і (2) наша культура не завжди приймає замовлення кольорів до змістовного обговорення.
Рис. 2.8 Можливе візуальне представлення даних зібраних з дискусійного форуму.
На рис. 2.8 можемо пізнати користувачів francesco і massimo, хто був найактивнішим в тому, щоб повісити нові оголошення на форумі і також в читанні. Користувачі росаріо і sebastiano, натомість, прочитали багато повідомлень, але дуже небагато брали за їх власними повідомленнями. Нарешті, ми можемо негайно вибрати користувачів michele і nino, хто був пасивним і в читанні і в передачі нових повідомлень.
Це - проблема, з якою ми стикаємося, за умови, що дуже часто до дійсних станів справ залучають дуже велику кількість даних, навіть мільйони пунктів. У цих випадках, коли область показу є дуже маленькою, щоб явно підтримати всі елементи візуального уявлення, використовуються різні методи, включаючи зміну масштабу зображення, сортування, центр плюс контекст, і чарівні лінзи.
Проектування візуального уявлення
Процедура, створення і візуалізації представлень абстрактних даних, може бути змальована у загальних рисах у наступних кроках:
1. Визначте проблему. Витрачаючи певну кількість часу з потенційними користувачами візуального уявлення. Ідентифікуйте їх ефективні бажання і потреби. Це необхідно, щоб ясно визначити те, що повинно бути представлене. Необхідно взяти до уваги людські чинники, визначені для потенційних клієнтів, до яких заява звернена і, зокрема їх пізнавальні і проникливі здібності.
2. Досліджуйте природу даних, щоб представити. Дані можуть бути кількісними (наприклад, список цілих чисел або дійсних чисел), порядковими (дані не числової природи, але у яких є їх власне значення, такий як дні тижня), або категоріальні дані (у яких немає ніякого властивого значення, такого як імена людей або міст). Різна картографія може бути відповідною, згідно типу даних.
3. Число вимірювань. Число вимірювань визначає репутацію даних.
Ознаки можуть бути незалежними або залежними. Залежні ознаки - ті, які змінюються і чиєю поведінкою ми цікавимося щодо незалежних ознак. Існують одно, двох, трьох і багато вимірні дані.
4. Структури даних. можуть бути лінійними (дані шифрують в лінійних даних, структуровані як вектори, панелі, колекції, і т.д.), тимчасовими (дані, які змінюються в часі), просторовими або географічними (дані, у яких є кореспонденція, така як карта, загальна топологічна структура, і т.д.), ієрархічними (дані щодо юридичних осіб організацій засновані на ієрархії, наприклад, генеалогії, блок-схеми, файли, і т.д.), і мережеві (дані, які описують відносини між юридичними персонами).
5. Тип взаємодії. визначає, чи є візуальне уявлення статичним (наприклад, зображення, надруковане на папері або зображення, представлене на екрані комп'ютера, але не підлягають зміні користувача), підлягають перетворенню (коли користувач може керувати процесом модифікації і перетворення даних, таких як зміна деяких параметрів введення даних, зміни крайнощів цінностей деяких ознак, або вибір різної картографії для створення уявлення), або маніпуляція (користувач може управляти і змінити деякі параметри, які регулюють покоління уявлень, як зміна масштабу зображення на деталях або обертання зображення, представленого в тривимірному вигляді).
Візуальне представлення лінійних даних
Колекція даних визначена як одновимірна, коли одна з її ознак змінюється щодо одного або більш незалежних ознак. Давайте припустимо, що ми маємо валовий національний продукт (ВНП), деяких країн в 2000 році. Таблична версія, є найефективнішою формою для негайної ідентифікації ВНП однієї з показаних країн. В основному, певна країна і її відповідний ВНП можуть бути негайно відібрані в алфавітному порядку оцінюваного списку. Може бути цікаво, порівняти ВНП однієї країни з іншою. Для цієї специфічної задачі таблична версія, не є ідеальним рішенням, і краще досліджувати інші типи уявлення.
Інша дуже стандартна форма одновимірного уявлення - гістограма.. Діаграми розсіювання і гістограми - дві стандартних форми візуального представлення інформації. Це дуже прості форми, безпосередньо ясні і зрозумілі.
Коли число залежних ознак два, ми говоримо про уявлення двовимірних даних. Припустимо, що ми повинні досліджувати загальну вартість закордонного імпорту і експорту товарів країн. Проте, щоб мати ефективне бачення розподілу імпорту і експорту цих країн, ми можемо представити ці цінності на графіку з двома осями рис. 2.9.
У цього типу уявлення є дуже висока виразна можливість, за умови, що найважливіші дані (імпорт і експорт) нанесені на карту і на осі , це найточніший візуальний спосіб відчувати кількісну інформацію.
Рис.
2.9 Двовимірний
графік з
ВНП, нанесеним на карту
На графіку помітно,
що серединна лінія позначена для таких
країн як Португалія, Польща була набагато
більше заснована на імпорті економіка
в 2000 році ніж для Бразилії і Аргентини.
Термін трьохвимірне уявлення використовують, коли три залежні ознаки змінюються щодо одного або більш незалежних ознак. Цей випадок стає складним, починаючи з двох просторових вимірювань Оскільки ми живемо в тривимірному світі, ми добре звикли до спостереження об'єктів, представлених в тривимірних просторах. Тому, це дуже природна річ, що ж необхідно зробити щоб розширити, і включати третє вимірювання, яке ми представляємо через перспективу. Рис. 2.10 надає нам приклад в якому ми згрупували ВНП і імпорт і експорт цінності раніше показаних країн.
Тут існують два типи проблем. Перш за все, у тривимірних представленнях є проблеми перешкоди коли деякі графічні елементи приховані позаду інших елементів. По-друге, важко ідентифікувати положення графічних елементів щодо осей.
Є різні стратегії для того, щоб вирішити ці типи проблем, які стосуються до всіх тривимірних уявлень, таким як обертання зображення, щоб показати закриті об'єкти або ідентифікувати цінності, пов'язані з кожною віссю. Таким чином, третім вимірюванням нехтують, але, з іншого боку, у нас є ясніше і точніше візуальне уявлення. Проте, проблема перешкоди все ще залишається.
Рис. 2.10 Трьохвимірний графік
Дані представлені в дво і тривимірному просторовому уявленні продемонстрували, як двовимірні уявлення більш ясні і більш точні ніж тривимірні. Проте, ми звикли до уявлення образу як зображення на двовимірному екрані, так, щоб третє вимірювання було модельоване при використовуванні перспективи. Крім того, деякі емпіричні дослідження показали, що тривимірні уявлення збільшують пізнавальний вантаж, або розумове зусилля користувача.
Рис. 2.11 Графічне представлення топології інтернет-мережі MBone в земному масштабі.
Двомірним уявленням повинна бути віддана перевага перед тривимірними. Тривимірні уявлення повинні використовуватися в обмежених і особливих випадках. Один випадок, в яких тривимірне уявлення надає яскравий, приклад, коли є потреба представити об'єкт у русі, або коли у даних, які будуть представлені, є тривимірний просторовий компонент, як Земля або структура молекули. Рис. 2.11 візуально представляє топологію мережі передачі даних, що використовується Інтернетом. Зображення уявлення - що створено через технологію VRML, яка дозволяє користувачу візуалізувати і досліджувати земну кулю в інтерактивному режимі, щоб зрозуміти структуру топології цієї мережі в кожній частині планети. Звичайно, це дуже ефективне представлення завдяки використовуванню технології VRML
В цьому розділі розглянута еталонна модель, яка описує процедуру, що надає інтерактивні візуальні уявлення від даних, за допомогою виконання трьох стадій: попередня обробка і перетворення даних, візуальна картографія, і створення уявлення. Кожний з них був проаналізований детально з практичним прикладом. Видно, як деякі операції, такі як вибір графічних елементів і властивостей, які використовують на візуальній стадії картографії, важливі і залежать від досвіду і здатності проектувальника системи.
Багатовимірний аналіз
Поняття багатовимірних даних, які являють собою набори даних, де багато атрибутів (як правило, більше чотирьох),визначають зміни у відношенні одного або декількох незалежних атрибутів. Існують численні приклади заходів, які ми проводимо щодня. Візьмемо, наприклад спробу купити стільниковий телефон. Переважне число моделей, пропонують найрізноманітніші функції. Смуги частот, Bluetooth, камера, GPRS, MMS, WAP, гучний зв'язок, і навіть Wi-Fi це лише деякі з численних сучасних функцій, які часто впливають на переваги нашого вибору одного мобільного телефону на інший.
Щоб вирішити, який мобільний телефон купити, потрібно взяти ті особливості, які нас цікавлять більше і задовольняють нашим вимогам. Оскільки є багато моделей, з особливостями, які розвиваються кожні шість місяців.
Це приклад, в якому процес прийняття рішення (купівля товарів), заснований на колекції багатовимірних даних (технічних характеристик телефонів), надається допомога (продавцем) з досвідом і знаннями про товари, які ми хочемо купити. Цей процес досконало працює, коли кількість екземплярів (стільникові телефони) і атрибути (особливості) не великі. Що станеться, якщо кількість стільникових телефонів буде надзвичайно велика, скажімо, сто чи навіть тисяча? Буде важко продавцю впоратися з усіма цими даними і повідомити про потрібний телефон без допомоги додаткових інструментів.
Тому не випадково, що один із секторів, в яких візуалізація інформації користується великим успіхом є системи підтримки прийняття рішень, як певний клас програмних систем, що допомагають у процесі прийняття рішень . Ці системи характеризуються великою кількістю даних та численних атрибутів та дуже важливі, оскільки вони забезпечують необхідну інформацію для менеджерів, аналітиків та директорів, які повинні приймати рішення, що мають вирішальне значення для функціонування компанії. У цьому розділі проаналізуємо деякі з найбільш поширених методів візуального представлення багатовимірних даних. Також покажемо деякі успішні випадки та приклади подань для дослідницького аналізу великих обсягів багатовимірних даних.
Проблема багатовимірної візуалізації
Раніше розглянули деякі приклади двох і трьохвимірних даних, які представлені простим розсіянням на декартові осі. Діаграми розсіювання дуже прості і інтуїтивно зрозумілі візуальні форми що добре працюють, коли є два залежних атрибута. Їх значення відображаються вздовж значення декартових осей. Проте, кількість ситуацій, в яких один або два з залежних атрибутів беруть участь дуже обмежена, і найбільш реальні проблеми мають досить велику кількість залежних атрибутів для аналізу. Діаграми розсіювання можуть бути розширені, що дозволяє мати відображення більше ніж двох атрибутів. Ми можемо, наприклад, продовжити діаграми розсіювання шляхом додавання візуальних елементів, на яких відображення даних може бути виконано наприклад, формою, розміром, кольором або текстурою, або додаванням третього виміру. Цими типами розширень, діаграми розсіювання можна візуально представляти дані, в яких є до семи різних атрибутів що можуть змінюватися.
Цей приклад, який показує дані з 174 країн і цілі для порівняння рівня добробуту (представлений валовий національний дохід кожного жителя) і стан здоров'я місцевого населення (представлено число випадків смерті дітей у віці до п'яти років на кожну 1000 новонароджених). Ці значення відповідно відображаються на осі х і осі у. Крім того, вони прагнуть представити число жителів (відображається як розмірність графічних елементів), і на континенті якому кожна країна належить (відображається на кольорі графічного елементу). Відразу безпосередньо звертає увагу майже лінійна кореляція між багатством і станом здоров'я: стан здоров'я покращується за умови багатства населення. Є також окремі випадки, які йдуть проти течії по відношенню до загальної тенденції, найбільш очевидним є Куба, населення якої має високий рівень охорони здоров'я, незважаючи на багатство. Що навіть вище, ніж у Сполучених Штатів у порівнянні з Індією. Інша цікава інформація з кольору кіл. Наприклад, африканські країни майже всі згруповані в лівому нижньому кутку графіка із зазначенням стану крайньої убогості і жахливого рівня здоров'я в цих нещасних народів.
Рис. 2.12 Розсіювання, які представляють чотири-мірні атрибути. Зображення опубліковано на даних, отриманих з статистичних досліджень.
Геометричні методи
Геометричні методи в візуалізації інформації складаються з відображення даних з атрибутів на геометричному просторі. Діаграми розсіювання належать до цієї категорії, але, обмежуються тим, що вони мають лише дві декартові осі, на якій карта має тільки два виміри. У 1981 році Альфред Інсельберг, науковий співробітник IBM, запропонував блискучу ідею визначення у геометричному просторі через довільну кількість осей, розташовуючи їх паралельно, а не перпендикулярно, як це було зроблено раніше. Це був початок однієї з найбільш поширених технік сьогоднішнього візуального представлення багатовимірних даних.
Паралельні координати
Цей метод бере свою назву від методу, де значення даних представлені: так що кожен атрибут відповідає осі та осі розташовуються паралельно на рівній відстані. Кожен запис даних представляє полігональний ланцюг, який пов'язує значення атрибутів на його осі.
Розглянемо приклад, щоб допомогти зрозуміти, як працює саме цей тип візуалізації. Давайте припустимо, що ми повинні представляти наступні дані про осіб через паралельні координати.
|
Вік |
Вага |
Стать |
Вінченцо |
32 |
75 |
Ч |
П’єро |
24 |
63 |
Ч |
Луїза |
28 |
60 |
Ж |
Джулія |
18 |
58 |
Ж |
Кожен запис даних має різні кольори для полегшення розуміння процесу генерації. Мова йде про тривимірні дані, два з яких є числа (вік і вага) і одно категоричне (стать). Ім'я особи, вважається незалежним даним. Ми представимо ці дані як відображення значень на три паралельні осі, використовуючи кількісні просторової підкладки для перших двох атрибутів і номінальні для останніх. Приєднавши точки, відповідні координати кожного запису, ми досягаємо подання що показано на рис. .2.13
Рис. 2.13 Паралельні координати уявлення.
Перейдемо до аналізу конкретного випадку, з використанням даних наданих у програмному забезпеченні, розробленому Метью Уордом. Програмне забезпечення є суспільним надбанням і може бути вільно застосовано. Дані містять технічні характеристики 392 моделей автомобілів виробництва в 1970-х років, з сімома залежними атрибутами. На основі аналізу даних за допомогою програмного забезпечення, ми можемо досягти візуального представлення яке показано на рис. 2.14.
Рис.2.14 Паралельні координати для 730 елементів з 7 варіантами атрибутів.
Паралельні координати дуже потужний інструмент для дослідницького аналізу даних. Наприклад, зворотній зв'язок між споживанням палива (MPG) і числом циліндрів у автомобілів легко помітною: перетин ліній, які з'єднують значення між двома осями наочно демонструє, як автомобілі з великою кількістю циліндрів (у верхній частині осі) охоплюють меншу кількість міль на галон, чим менше циліндрів. Інший чіткий зворотній зв'язок, є між вагою і прискоренням автомобіля бо важкі автомобілі, як правило мають, короткі прискорення (мається на увазі час, необхідний для досягнення певної швидкості, починаючи від стану спокою).
Хоча вони є дуже потужним інструментом дослідницького аналізу, паралельні координати можуть представити деякі проблеми з дуже великими обсягами даних (наприклад, у наборі з 5000 елементів). У таких випадках, візуальне подання може бути занадто щільним, щоб розрізнити лінії скорочення представництва. Ця проблема притаманна будь-якому візуальному уявленню: Місця на екрані може бути недостатньо щоб вмістить всі візуальні елементи.
Рис. 2.15 Чистка значень на паралельних координатах.
Червоні лінії представляють елементи, які задовольняють всі обмеження на значення що позначаються фіолетовим фоном.
Матриця розсіяння
Матриці розсіяння представляють цікаві розширення загального 2D розгляду сюжету, просто і інтуїтивно представляють загальне число багатовимірних атрибутів. Це дуже проста техніка складається з представлень пари ознак, через двовимірної діаграми розсіювання, і покладання діаграм розсіювання на площину.
Таким чином формується матриця, де N це кількість атрибутів для подання. Малюнок 2.16 ілюструє, приклад, породжений за допомогою програмного забезпечення, використовуючи той самий набір даних, який раніше використовувався для паралельних координат.
Рис. 2.16 Матриця розсіювання багатовимірних даних
З малюнка, видно тип кореляції, який курсує між різними парами атрибутів. Наприклад, абсолютно ясно, що за рахунок збільшення кінських сил і ваги, кількість міль покриття (в термінах міля на галон,) значно знижується (див. графіки що включені в синій рамці). Використання матриці розсіювання, робить зв'язок між парами відразу помітним, що не потребує втручання візуального представлення. З іншого боку, матриця розсіювання може представити деякі незручності. Неможливо поставити етикетки для позначення окремих точок, або вибрати конкретний момент за допомогою миші, щоб прочитати значення її координати. Крім того, втрачається колективне бачення всіх атрибутів, які ми спостерігали раніше.
Таблиця лінзи
Таблиці, додатки, такі як Microsoft Excel, стали одним з найбільш поширених типів програмного забезпечення. Завдяки дуже інтуїтивному візуальному інтерфейсу, а також завдяки деяким дуже ефективним ініціативам маркетингу, цей тип інструменту є частиною програмного забезпечення устаткування кожного комп'ютера. Велика інтуїція, яку мали творці даного програмного забезпечення ще на початку 1980-х було запропоновано використовувати структуру, аналогічну таблиці множення для виконання розрахунків, в дуже простій організації даних. Слідуючи цьому принципу, в 1994 році Джон Лампінг і Рамана Рао пропонують візуальний інструмент аналізу даних, які називаються таблиці лінз. Його структура була натхненна поширенням для представлення даних з допомогою горизонтальних смуг, а не числових значень. Зокрема, дані представлені матрицею, де атрибути представлені в колонки і кожен екземпляр даних розміщується в рядках матриці. Чисельні значення атрибутів набору даних зіставляються з довжиною горизонтальних смуг. Візуально, горизонтальні смуги можуть бути представлені в дуже обмеженому просторі. Таким чином йому вдається представляти велику кількість атрибутів та випадків, в одному екрані і дозволяє користувачам відразу визначити можливі моделі, тенденцій і взаємозв'язків між атрибутами рис 2.17.
Рис. 2.17 Представлення таблиці лінз
Цікавою особливістю цього типу уявлення є можливість користувачеві взаємодіяти з візуалізацією • зміна порядку стовпців, • приховати або показати стовпці, • сортувати дані за значеннями стовпця, • показати значення в деяких випадках без втрати контексту всієї візуалізації.
Рис.2.18 Таблиця лінз відсортована за значеннями першого стовпця.
Приклад показаний на рис.2.18 де дані відсортовані за значеннями першого стовпця ліворуч.
Геометричні методи, обговорювані досі можуть бути використані з будь-яким типом атрибута.
Рис.2.19 Представлення даних катастрофи Титаніка з використанням паралельних множин. Цей тип подання, на відміну від паралельних координат, виявляється більш доцільним у разі категоріальних даних
Рис.2.19 показує уявлення зокрема, паралельні набори даних, отриманих з жертв катастрофи Титаніка, після зіткнення з айсбергом в ніч на 14 квітня 1912 року. Набір даних складається з чотирьох залежних атрибутів: вік пасажирів, статі, класу, в якому вони подорожували, і чи вони пережили катастрофу. Макет нагадує паралельні координати, але, в даному випадку, були замінені на число прямокутників, які представляють категорії. Ширина цих прямокутників відповідає частоті відповідної категорії (наприклад, в зоні, яка представляє статі, було 470 жінок пасажирів і 1731 чоловіків пасажирів; розмір прямокутника відображає цю частку дуже ясно). Крім того, кількісні ознаки можуть бути відображені на осі, як ми бачимо у випадку віку. Атрибути розташовані поруч один з одним пов'язані у сполуки, що в цьому випадку є значення частот, в якому умови перевіряються. Наприклад, на малюнку, атрибут у верхній частині, стосується тих що залишилися в живих, поділяється на дві області. Ті, хто пережив лихо розташовані по відношенню до пасажирського класу, до якого вони належать.
Методи іконок
Інше сімейство методів представлення багатовимірних даних, яке використовує геометричні властивості фігури називається методом символьних іконок. Назва походить від того, що геометрична фігура (ікона, яку в даному випадку також називають символом), може мати ряд особливостей, які можуть відрізнятися: колір, форма, розмір, орієнтація і т.д. Основна ідея полягає у асоціюванні кожного атрибуту з функцією в геометричну фігуру і відображення даних на великій кількості властивостей кожного компонента. Розглянемо два з відомих методів: зірки ділянок та особи Чернова.
Зірка ділянки
Проста та інтуїтивна геометрична фігура представлена зоряним багатокутником, вершини якого визначають множину осей, що всі мають спільне походження. Кожен екземпляр набору даних може бути представлений як "зірки", в яких значення кожного атрибута зіставляються з довжиною кожної вершини. Приєднавшись до точок, які відповідають кожній вершині, геометрична фігура яка виходить, має специфічну форму яка глобально описує примірник набору даних. Цей метод, названий зіркові ділянки, може бути дуже корисним.
П
орівнюючи
різні випадки з набору даних, просто
порівнюючи полігональної форми, отримані
від кожного символу можна робити різні
висновки про дані. На рис.2.20, ми можемо,
наприклад, порівняти статистичні дані
деяких кліматичних значень, представлених
зірками ділянки. Представлені атрибути
середньорічна кількість опадів,
середньорічна температура, середня
максимальна річна температура, середні
мінімальні річні температури, рекорд
максимальної температури і рекорд по
мінімальній температурі. Ці дані
надходять з багаторічної статистики.
Різні атрибути зіставляються з довжиною
кожної вершини зірки, починаючи з права
і виходячи проти годинникової
стрілки.
Місто Середні Середні Сер. макс. Сер. мін. Макс. зафіксована Мін. зафіксована
Афіни 37 17 21 13 42 −3
Бухарест 58 11 16 5 49 −23
Канберра 62 12 19 6 42 −10
Дублін 74 10 12 6 28 −7
Гельсінки 63 5 8 1 31 −36
Гонконг 218 23 25 21 37 2
Лондон 75 10 13 5 35 −13
Мадрид 45 13 20 7 40 −10
Мехіко 63 17 23 11 32 −3
Москва 59 4 8 1 35 −42
Нью-Йорк 118 12 17 8 40 −18
Порто 126 14 18 10 34 −2
Ріо-де-Жанейро 109 25 30 20 43 7
Рим 80 15 20 11 37 −7
Туніс 44 18 23 13 46 −1
Цюріх 107 9 12 6 35 −20
Рис. 2.20 Кліматична оцінка в градусах Цельсія у деяких містах світу.
З подання зірки ділянки на рис. 2.20, ми помічаємо, що Москва і Гельсінкі мають подібні кліматичні характеристики, як і Афіни та Туніс. Просто порівнюючи форми породжених зірками сюжетів, ми можемо візуально відрізнити угруповання елементів різних наборів даних.
Секрет успіху
Представникам різних соціальних верств задано одне і те ж питання: «у чому основні причини успіху?». Результат подано як зіркову ділянку. Як видно з відповідей, бідним перш за все потрібно міняти свій підхід до життя.
Очевидно межа уявлень цього типу полягає в поданні масштабу. Для кількох дуже малих елементів, простір на екрані стає настільки маленьким, що важко чітко розгледіти і порівняти різницю знакових форм. Крім того, знакові методи застосовуються при якісному, а не кількісному аспекті порівняння різних атрибутів набору вивчення даних.
Рис.2.21 Зірки ділянок щорічних кліматичних даних деяких міст
Особи Чернова
Герман Чернов запропонував цікаву техніку уяви позначок, в якій елемент подання не невиразний і нудний полігон зірка, а обличчя "особа" . Це важливо тому що люди, особливо здатні визначати навіть найменші зміни в людській міміці. Чернов пропонує відображення атрибутів колекції багатовимірних даних у форму, розміри і орієнтація якої подібні людським рисам обличчя, таким як очі , ніс, рот, вуха і т.д. рис. 2.22 дає приклад подання, через особу Чернова, про кліматичні дані міст, які ми раніше розглядали. Відображення подано на рис. 2.22.
Як і у випадку зіркових ділянок з цих сюжетів, ми можемо вивести подібності між містами Гельсінкі та Москвою й Афінами та Тунісом. Цей тип відображення використовує знайомі риси обличчя що відразу помітно, з більшою виразною силою, ніж зіркові ділянки. Наприклад, вибравши на карті області ті особи, де розглянута середня кількість опадів у місті, ми відразу бачимо, що Гонконг є дуже дощове місто. Вибір відображення між атрибутами та елементами особи є критичним і, якщо погано проводиться, може призвести до неправильних спостережень.
Особа Чернова.
Можна зрозуміти, що такі міста, як Ріо-де-Жанейро і Туніс розташовані в кращих кліматичних умовах, ніж інші, тільки тому, що особа має усміхнений вираз.
Цей тип уявлення дуже цікавий, тому що його спосіб представлення даних, навіть якщо він був підданий критиці за ці роки численними експертами з візуалізації, тому, що симетрія частин, таких як очі, брови, вуха, присутні парами на обличчі , здатні створювати непотрібне дублювання. Крім того, дослідження показали, як вибір відображення атрибута може призвести відмінностей до 25% в рамках кластерного сприйняття в наборі даних. Це означає, що для класифікації двох осіб, як "подібні" широко впливає вибір відображення функції конкретного атрибута однієї особи замість іншого.
Рис. 2.22 Кліматичні дані деяких міст представлені особами Чернова
Піксельно орієнтовані прийоми
Для максимального представлення числа елементів, деякі методи, використовують пікселі на екрані в якості основних одиниць подання. По суті, піксель представляє найменшу частину, "атомних" блоків, поза якими неможливо розділити подання. Екран комп'ютера містить кілька мільйонів пікселів і тому може потенційно становити безліч окремих елементів відображення одновимірних даних. Дані атрибути кольору пікселя відповідного елемента. Таким чином, ми отримуємо верхню межу видимих елементів на одному екрані, за яким це теоретично неможливо. На практиці, ця межа ніколи не досягається, по-перше, тому що частина екрана містить функціональні і естетичні елементи уявлення, такі як кнопки, рамки, текстові елементи, по-друге, тому що є дуже обмежене число ситуацій, де достатньо відображення одиниці інформації в кольори одного пікселя на екрані.
Розглянемо, як застосовувати ці методи, для колекція багатовимірних даних. Мета складається в представленні найбільшого обсягу даних в одному екрані, відображення кожного значення в колір пікселя на екрані і угруповання даних, які належать до певних атрибутів в конкретній області, що називається вікном. Даніель Кейма вивчав підхід з теоретичної точки зору і визначив ряд факторів, які необхідно враховувати при застосуванні цього методу:
• Вікна зазвичай представлені в прямокутній формі і розташовані як матриця на екрані. Інші форми також були запропоновані, але прямокутник залишається найбільш підходящим для кращого використання фізичного простору екрану.
• Візуальне відображення. Що кожен піксель представляє?
• Організація пікселів. Як пікселям бути організованим в кожному вікні?
• Колір відображення. Які кольори пікселів відображаються?
• Замовлення вікон. У якому порядку розташовані в Windows екрани фізичного простору?
Як приклад таких додатків, рис.2.23 показує, інструмент для моніторингу використання онлайн курсів на платформі електронного навчання. Платформи електронного навчання, до теперішнього часу, дуже розповсюджений інструмент в університетах. Для управління або статистичних цілей, він може бути надзвичайно корисним для розуміння рівня використання студентів кожного курсу онлайн. Проблема в тому, що платформа може опрацювати сотні (або навіть тисячі) курсів, і тому відслідковувати рівень використання кожного курсу що може бути дуже складним для оцінювання. Випадок, показаний на рис. 2.23 служить саме цій меті. Це свого роду прилад панелі використання ресурсів у платформі електронного навчання.
Рис. 2.23 Приклад програми, що використовує в якості основної одиниці пікселі.
Кожне вікно представляє інтерактивний курс платформи, в той час як пікселі представляють одиницю часу (1 хвилина, 1 годину, 1 день, і т.д.). Пікселі розподілені згідно часової спіралі, з першого пікселя (по порядку часу), розташованих в центрі маленького вікна, а потім поширюється на край в напрямку за годинниковою стрілкою.
Пікселі пофарбовані в залежності від кількості використання курсу протягом часу, відповідного пікселя. Колірна гамма використовується з одного синього відтінку, що складає більше, ніж 345 курсів в одному екрані, тоді зрозуміло, які курси мали найбільшу активність протягом семестру. Аналізуючи розташування кольорових пікселів в деталях, можна зрозуміти, що діяльність була зосереджена на початку або в кінці семестру, або як вони розподілені протягом семестру. Переваги цього підходу відрізняються не тільки кількістю даних, що вдасться представити в одному екрані, але і для простоти інтерпретації, яка з пізнавальної точки зору, не вимагає особливих зусиль.
Ще один цікавий приклад ринку це радар, виробництва компанії Smart Money, яка пропонує інвесторам фондового ринку, широкий ряд аналітичних інструментів, які використовують сучасні технології для візуального подання інформації. Радіолокаційний аналіз ринку історії акцій що котируються на американських фондових ринках (рис. 2.24).
,
Рис. 2.24 Радар ринку який керується програмою Smart Money для аналізу історії акцій фондового ринку.
Візуалізація зміни цін 500 акцій протягом останніх 8 років, дозволяє вивчити весь динамічний ринок, більш істотно за тривалий період часу. Радіолокація ринку займає тижневі коливання цін. Кожний тиждень представлений у колонці в лівій частині малюнка, в той час як інші рядки матриці відповідають кожній акції.
Акції згруповані в секторах, для вивчення розвитку різних типів секторів або галузей. Кожні щотижневі зміни цін представлені точкою в матриці ліворуч: зеленим, якщо акції пішли вгору на цьому тижні, червоним, якщо вони пішли вниз, у той час як інтенсивність кольору відображає зміну по відношенню до попереднього тижня. У прикладі, ясно помітно, як акції, що належать до технологічного сектора мають найвищий рівень нестабільності, характеризується різкими максимумами і мінімуми в дуже короткі періоди часу. Користувач може помістити свого роду збільшувальне скло на певній області в матриці, для покращення сприйняття там, де стан кожної компанії може бути чітко відокремленим. Приклад, показаний на малюнку представляє зразки вкрай негативного тижня для більшості акцій, відповідно до атаки на вежі-близнюки в Нью-Йорку 11 вересня 2001 року
У цьому розділі описані деякі з найбільш поширених методів, використовувані для представлення багатовимірних даних, які характеризують більшість реальних проблем. Завдання полягає в тому, щоб візуально представити багатовимірні дані у двовимірному просторі екрана. Це обмеження змушує вдатися до хитрощів, щоб виникла карта кількох атрибутів, ці методи мають три категорії: геометричні, знакові, і на основі пікселів.