3.5. Види агрегування
Як і декомпозиція, техніка агрегування ґрунтується на використанні моделей досліджуваної чи проектованої системи. Саме обрані нами моделі жорстко визначають, які частини мають увійти до складу системи (модель складу) і як вони мають бути пов'язані між собою (модель структури). Унаслідок різних умов і цілей агрегування потрібно використовувати різні моделі, від чого, у свою чергу, залежить як тип остаточного агрегату, так і техніка його побудови.
У найзагальнішому вигляді агрегування можна означити як установлення відношень на заданій множині елементів. Унаслідок значної свободи вибору в тому, що саме розглядати як елемент, як утворено множину елементів і які відношення встановлено (тобто виявлено чи нав'язано) на цій множині, виникає дуже велика кількісно й різноманітна якісно множина задач агрегування. Зазначимо тут лише основні агрегати, типові для системного аналізу: конфігуратор, агрегати-оператори й агрегати-структури.
Усяке дійсно складне явище потрібно різнобічно й багатопланово описати, розглянути з різних точок зору. Тільки спільний опис (агрегування) у термінах декількох якісно різних мов дає змогу достатньо повно охарактеризувати явище. Наприклад, автомобільну катастрофу слід розглядати не тільки як фізичне явище, зумовлене механічними причинами (технічним станом автомобіля та дорожнього покриття, силами інерції, тертя, ударів тощо), але і як медичне, соціальне, економічне, юридичне. У реальному житті не буває чисто фізичних, хімічних, економічних, суспільних або навіть системних проблем – ці терміни позначають не саму проблему, а обраний погляд на неї. За образним висловом письменника-фантаста П. Андерсона, проблема, хоч би якою складною вона не була, стане ще складнішою, якщо її правильно розглядати.
Ця багатоплановість реального життя дуже важлива для системного аналізу. З одного боку, системний аналіз має міждисциплінарний характер. Системний аналітик готовий досліджувати системи з будь-якої галузі знань, залучати експертів будь-яких спеціальностей, якщо це в інтересах справи; з іншого боку, перед ним постає неминуче питання про припустиму мінімізацію опису явища. Якщо в декомпозиції це питання можна компромісно зважити за допомогою поняття істотності, що дає певну свободу вибору, супроводжувану ризиком недостатньої повноти чи надмірної деталізації, то в разі агрегування воно загострюється: ризик неповноти стає майже неприпустимим, оскільки тоді мова може йти взагалі не про те, що ми маємо на увазі; ризик перевизначення пов'язаний із великими зайвими витратами.
Наведені поняття дають змогу означити поняття агрегату, який складається з якісно різних мов опису системи; кількість цих мов мінімальна, але потрібна для досягнення заданої мети. За В. Лефевром назвемо такий агрегат конфігуратором.
Головне в конфігураторі не те, що потрібно аналізувати об'єкт окремо кожною мовою конфігуратора, а те, що синтез, проектування, виробництво й експлуатація приладу можливі тільки за наявності всіх його описів.
Приклад 1. Обговорюючи кандидатури на керівну посаду, кожного претендента оцінюють з урахуванням його професійних, ділових, ідейно-політичних, моральних якостей і стану здоров'я.
Приклад 2. Описуючи процеси, що відбуваються в народногосподарських комплексах обласного масштабу, для характеристики будь-якого вихідного продукту виробничої сфери чи сфери обслуговування використовують три типи показників: натуральні (економіко-технологічні), грошові (фінансово-економічні) та соціально-ціннісні (ідеологічні, політичні, етичні й естетичні). Діяльність заводу та театру, ферми та школи, будь-якого підприємства й організації описують трьома мовами, які утворюють конфігуратор стосовно цілей автоматизованої системи управління господарством області.
Приклад 3. Досвід проектування організаційних систем показує, що конфігуратор для синтезу такої системи складається з опису розподілу влади (структури підпорядкованості), відповідальності (структури функціонування) й інформації (організації зв'язку та пам'яті системи, нагромадження досвіду, навчання, історії). Усі три структури не обов'язково мають збігатися топологічно, хоча вони й поєднують одні й ті самі частини системи.
Конфігуратор – це змістовна модель найвищого можливого рівня. Назвавши мови, якими ми будемо говорити про систему, тим самим можна визначити, синтезувати тип системи, зафіксувати наше розуміння її природи. Як усяка модель, конфігуратор має цільовий характер і зі зміною мети може втратити свої основні властивості. Очевидно, що в простих випадках конфігуратор – адекватна модель; в інших випадках його адекватність підтверджує практика; у повноті третіх конфігураторів ми лише більш-менш упевнені й готові доповнити їх новими мовами.
Найчастіше агрегування потрібне тоді, коли сукупність даних, з якими доводиться мати справу, занадто велика, погано доступна для огляду, із цими даними важко працювати. На перший план виходить така особливість агрегування, як зменшення розмірності: агрегат поєднує частини в щось ціле, єдине, окреме.
Найпростіший спосіб агрегування полягає в установленні відношення еквівалентності між агрегованими елементами, тобто утворення класів. Це дає змогу говорити не тільки про клас у цілому, але й про кожен його елемент окремо.
Можна розглядати різні задачі, пов'язані з класифікацією та її використанням. Класифікація – дуже важливе та багатофункціональне, різнобічне явище в людській практиці взагалі й у системному аналізі зокрема. Із практичного погляду одна з найважливіших проблем – визначення, до якого класу належить конкретний елемент.
Якщо ознака належності до класу безпосередньо спостережувана, то особливих труднощів класифікації немає. Однак і тоді на практиці виникає питання про надійність, правильність класифікації. Наприклад, розкласти пофарбовані шматки картону за кольорами – важке завдання навіть для вчених-психологів, бо незрозуміло, до якого класу віднести жовтогарячий шматок: до червоних чи до жовтих, – якщо між ними немає інших класів? Якщо безпосередньо спостережувану ознаку належності до класу сформульовано природною мовою, то, як відомо, стає неминучою певна невизначеність (розпливчастість).
Складність класифікації різко зростає, якщо ознака класифікації не спостережувана безпосередньо, а сама являє собою агрегат непрямих ознак. Типовий приклад – діагностика захворювання за результатами анамнезу: діагноз хвороби (її назва – ім'я класу) – це агрегат великої сукупності її симптомів і характеристик стану організму. Якщо класифікація має природний характер, то агрегування непрямих ознак можна розглядати як виявлення закономірностей у таблицях експериментальних даних, тобто як пошук стійких, досить часто повторюваних у навчальній вибірці поєднань ознак. При цьому доводиться перебирати всі можливі комбінації ознак, щоб перевірити їх повторюваність у навчальній вибірці. Узагалі, метод перебору варіантів – найбільш очевидний, простий і надійний спосіб пошуку рішення. Незважаючи на трудомісткість, його нерідко з успіхом застосовують. Т. Едісон твердив, що перебір – основний метод його винахідницької діяльності (хоча, швидше за все, це жарт). Однак уже в разі зовсім невеликої кількості ознак повний перебір стає нереальним навіть із використанням ЕОМ. Успіх значною мірою залежить від того, чи вдасться знайти метод скорочення перебору, який дає змогу отримати "хороше" рішення. Розробці таких методів присвячено багато досліджень.
Інший тип агрегату-оператора виникає, якщо агреговані ознаки зафіксовано в числових шкалах. Тоді можна задати відношення на множині ознак у вигляді числової функції декількох змінних, яка являє собою агрегат.
Свобода вибору в заданній функції, що агрегує змінні, удавана, якщо надати їй якогось реального змісту. У цьому відношенні характерний перехід від багатокритеріальної оптимізаційної задачі до однокритеріальної за допомогою агрегування декількох критеріїв у один суперкритерій. Суперкритеріальна функція – це, власне кажучи, модель системи. Не знаючи "істинної" впорядкованої функції, можна апроксимувати її гіперплощиною (тобто лінійною комбінацією частинних критеріїв), прагнучи, щоб ця гіперплощина була "досить близька" до невідомої суперповерхні (тоді порівнювані альтернативи близькі до точки торкання суперплощини із суперповерхнею). Якщо ми не в змозі забезпечити це, то можна використовувати частинно-лінійні й інші нелінійні апроксимації, тобто інші агрегати критеріїв, або взагалі відмовитися від їх агрегування в один критерій. Паретівська оптимізація в якомусь розумінні аналогічна відмові від агрегату-оператора та поверненню до агрегату-конфігуратора.
У тих (на жаль, рідкісних) випадках, коли агрегат-оператор являє собою цілком адекватну модель системи, узагалі немає свободи вибору функції, що агрегує набір змінних. Саме так буває, коли закономірності природи відображають безрозмірні степеневі одночлени фізичних величин (тобто залежних від декількох інших величин) у разі зміни одиниць виміру вихідних величин. Це дає змогу сформулювати такий нетривіальний висновок: якщо вдалося побудувати безрозмірний степеневий одночлен із розмірних фізичних величин, які утворюють конфігуратор розглянутого явища, то виявлено фізичну закономірність цього явища.
Рідкісний приклад однозначності функції-агрегату – широко використовуваний вартісний аналіз економічних систем. Якщо всі фактори можна виразити в термінах грошових витрат і доходів, то агрегат виявляється їх алгебричною сумою. Питання полягає лише в тому, коли можна використовувати цей агрегат, не звертаючись до інших систем цінностей, а коли слід повернутися до конфігуратора, який містить політичні, моральні, екологічні, а не тільки фінансові критерії.
Додамо, що числову функцію можна задавати не тільки на числових аргументах, і це дає змогу розглядати ще один вид агрегату-функції.
Важливий приклад агрегування даних дає статистичний аналіз. Серед різних агрегатів (називаних у цьому разі статистиками, тобто функціями вибіркових значень) особливе місце посідають достатні статистики – агрегати, які добувають усю корисну інформацію про потрібний параметр із сукупності спостережень. Однак у разі агрегування зазвичай неминучі втрати інформації, і достатні статистики щодо цього – виняток. За таких умов важливі оптимальні статистики, що в певному розумінні дають змогу звести неминучі втрати до мінімуму. Наочний приклад статистичного агрегування являє собою факторний аналіз, у якому декілька змінних зводять в один фактор. Саме тому, що під час розгляду реальних даних найважливіше – це побудова моделі-агрегату в разі браку інформації, потрібної для теоретичного синтезу статистики, Дж. Тьюкі запропонував назвати цю галузь аналізом даних, залишаючи за математичною статистикою задачі алгоритмічного синтезу та теоретичного аналізу статистик.
Нарешті, зі створенням агрегату-оператора пов'язаний не тільки виграш, заради якого його створюють, але й ризик потрапити в "пастки". Зазначимо основні з них:
втрата корисної інформації. Агрегування – незворотне перетворення (наприклад, за сумою неможливо відновити доданки), що в загальному випадку призводить до втрат; достатні статистики – лише щасливий виняток (якщо сума – достатня статистика, то інформація про окремі доданки не потрібна);
агрегування – це вибір певної моделі системи, з яким пов'язані непрості проблеми адекватності;
деяким агрегатам-операторам притаманна внутрішня суперечливість, поєднана з негативними (стосовно цілей агрегування) наслідками. Найяскравіший приклад цього – теорема про неможливість, але чи мають цю властивість (хоча й виражену в різному ступені) усі агрегати?
Важлива (а на етапі синтезу – найважливіша) форма агрегування – утворення структур. До вже сказаного про моделі структур можна додати ось що.
Як і будь-який вид агрегату, структура – це модель системи, тому її можна задати потрійною сукупністю: об'єктом, метою та засобами моделювання. Це й пояснює різноманіття типів структур (мережі, матриці, дерева тощо), які виникають у процесі їх виявлення й опису (пізнавальні моделі).
Під час синтезу ми створюємо, визначаємо, нав'язуємо структуру майбутній (проектованій) системі (прагматичні моделі). Якщо це не абстрактна, а реальна система, то в ній цілком реально (тобто незалежно від нашого бажання) виникнуть, установляться й почнуть "працювати" не тільки спроектовані нами зв'язки, але й безліч інших, не передбачених, які випливають із самої природи зведених в одну систему елементів. Тому, проектуючи систему, важливо задати її структуру в усіх істотних відношеннях, тому що в інших відношеннях структури складуться самі, стихійно (звичайно, не зовсім незалежно від установлених і підтримуваних проектних структур). Сукупність усіх істотних відношень визначається конфігуратором системи, і звідси випливає, що проект будь-якої системи має містити розробку стількох структур, скільки мов включено в її конфігуратор. Наприклад, у проекті організаційної системи мають бути структури розподілу влади, відповідальності й інформації. Хоча ці структури можуть суттєво різнитися топологічно (наприклад, структура підпорядкованості ієрархічна, а функціонування організоване за матричною структурою), вони лише з різних боків описують одну й ту саму систему, тому не можуть бути не пов'язані між собою.
У сучасних системних науках усе більшу увагу приділяють одному зі специфічних видів структур – так званим семантичним мережам. Початок їх дослідженню й застосуванню поклав у 60-х роках XX ст. Д. Поспелов у розвинутому ним ситуаційному управлінні. Тепер такі мережі з різних позицій вивчають у багатьох наукових колективах, оскільки логіко-лінгвістичні моделі (інша назва семантичних мереж) виявилися в центрі всіх подій, що відбуваються в дослідженнях штучного інтелекту та його застосувань. Це пов'язано з тим, що зазначені моделі відображають структуру людських знань, які виражаються природною мовою, причому таке відображення можна реалізувати засобами ЕОМ.
Хоча можна навести, здавалося б, усі мислимі структури як окремі випадки повного графа, деякі явища природи наводять на думку, що в цьому питанні не слід поспішати з остаточними висновками. Окремі особливості живих організмів, економічних і соціальних систем змушують припустити, що навіть найскладніші моделі структурної організації в чомусь занадто прості.
Так, тривалий час уважали, що тропічні ящірки-гекони здатні бігати по стінах і стелі завдяки мікроскопічним присоскам на лапках. Коли ж виявилося, що гекон не може бігати по полірованому склу, з'ясувалося, що ніяких присосків немає, а є багато тисяч дрібних волосків, що з усіх боків обхоплюють, а в потрібний момент відпускають найменші шорсткості поверхні стіни чи стелі. У процесі погоні за мухою кожному волоску-щупу потрібно віддати правильну команду в потрібний момент! Ясно, що централізована система з цим не справиться, але як тоді синхронізується нецентралізоване керування?