
- •9. Інтелектуальні системи
- •9.1. Інтелектуальний аналіз даних
- •9.2. Математичний і програмний арсенали іад
- •9.3. Місце і роль іад у системі підтримки прийняття рішення
- •Архів даних
- •9.4. Проблеми збереження і пошуку даних
- •9.5. Проблеми вибору математичного інструментарію
- •9.6. Проблема закритої математики
9.5. Проблеми вибору математичного інструментарію
Наведений вище короткий опис математичного арсеналу ІАД достатньо наочно ілюструє різноманіття пропонованого інструментарію, призначеного для вирішення різних задач СППР. При цьому одну і ту ж задачу виявляється цілком допустимо і можливо вирішувати різними математичними методами. Виникає очевидне питання: якому саме інструменту віддати перевагу в кожному конкретному випадку?
Дане питання далеко не вичерпує спектра проблем, пов'язаних з застосуванням вже створеної системи ІАД. Зокрема, застосування того або іншого пакета, зазвичай, зв'язане з установкою низки параметрів, правильний вибір яких істотно впливає на якість формованого рішення. А коректне визначення цих параметрів вимагає попереднього дослідження природи наявних даних і глибокого розуміння застосовуваного математичного апарата.
Так, наприклад, апроксимація досліджуваного процесу на основі метода найменших квадратів (МНК), „зашитого” в більшість стандартизованих математичних пакетів ІАД, достатньо ефективне для традиційної гауссовської моделі послідовностей вихідних даних.
Однако, якщо реальні спостереження підкорені іншому розподілу (наприклад, розподілу Лапласа) або просто містять аномальні і ефективність МНК істотно знижується, що неминуче позначиться на достовірності сформованої оцінки ситуації або точності прогнозу. У цьому випадку виявляється доцільним використовувати метод найменших модулів або, ще краще, спеціальні робастні методи параметричного оцінювання.
Зрозуміло, можна спробувати здійснити порівняльний аналіз різних аналітичних методів для якогось набору можливих ситуацій і сформувати деякі загальні рекомендації з вибору того або іншого алгоритму. Однак очікувати практичної користі від таких рекомендацій дуже складно: практично будь-яка задача повсякденної практики володіє спектром характерних особливостей, в результаті яких апріорні вказівки дуже часто виявляються корисними з точністю „до навпаки”! Як приклад можна розглянути задачу прогнозування на підставі часових рядів. Автоматичний вибір порядку авторегресії – ковзного середнього з точки зору мінімуму динамічної помилки може привести до застосування моделі дуже високого порядку. В результаті істотно зросте статистична помилка, що неминуче знизить точність остаточної прогностичної оцінки.
Іншим ілюстративним прикладом може служити процес навчання нейронних мереж. Застосування для цих цілей ретроспективних даних позитивно впливає на якість одержуваних рішень лише при використанні інформації певної історичної „глибини”. Занадто далекі дані можуть володіти зовсім іншою статистичною структурою і їх використання як навчальних послідовностей для нових умов може лише знизити якість прогнозу.
Природним виходом з цього положення є включення до складу експертної групи фахівця в галузі data mining – експерта-аналітика з необхідною математичною підготовкою. Вимога математичних знань настільки високого рівня від предметних експертів, фахівців в галузі економіки, фінансів, менеджменту тощо є свідомо нереальним.
Очевидно, що експерту-аналітику також необхідне розуміння змістовної частини розв'язуваної задачі, щонайменше на рівні робочої взаємодії з предметним експертом. Не виключене, що остання умова вимагатиме його додаткового короткострокового навчання.
Крім того, включення аналітичної експертизи в структуру СППР ускладнює загальну схему вироблення проекту рішення. Незважаючи на це, як свідчить досвід застосування вже існуючих складних систем з ІАД, реальна можливість підвищення достовірності формованих оцінок ситуацій і точності прогнозу, швидко окупає додаткові витрати на data mining. І навпаки, „якщо сподіватися на легке, то неодмінно буде багато труднощів” (Лао-цзи, 579-499 рр. до н.е.).