
- •Аналіз проблеми інформаційного синтезу ск, що навчаються
- •Логіко-гносеологічний аспект вирішення проблеми інформаційного синтезу ск, що навчаються
- •1.3. Аналіз методів і підходів до інформаційного синтезу комп’ютерізованих ск
- •1.4. Сучасний стан і тенденція розвитку методів автоматичної класифікації
- •1.5. Структура і функціонування нечітких регуляторів інтелектуальних ск
1.5. Структура і функціонування нечітких регуляторів інтелектуальних ск
Після обґрунтування у 1965 р. Л.А. Заде [155] принципу несумісності для складних систем, для яких практично неможливе цілком адекватне математичне моделювання в рамках традиційної математики, в теорії керування з’явився новий клас нечітких регуляторів, які дозволили розширити межи застосування теорії керування і на слабо формалізовані процеси. Узагальнена класична схема нечіткого регулятора показана на рис. 1.2 [224].
Рис. 1.2. Інтелектуальна СК з нечітким регулятором (Мамдані й
Ассиліані, 1970 р.)
Основна відмінність нечіткого регулятора від чіткого, як показано на рис. 1.2 полягає в наявності фазифікатора для перетворення вхідних даних, які існують у різних чітких формах, в нечітку форму та дефазіфікатора для формування чіткого керуючого сигналу. Нечіткий логічний вивід полягає в реалізації способу виведення, що ґрунтується на використанні тверджень, які набувають не тільки значення “істинно” та “хибно”, але й будь-які проміжні значення.
Для придання інтелектуальній СК властивості адаптації Мізумото М. і Танака К. запропонували в 1997 р. нечіткий регулятор, що самонастроюється, схему якого показано на рис. 1.3 [225]. Основна ідея функціонування запропонованого ними нечіткого регулятора полягає в необхідності оцінки поточного функціонального стану системи за енергетичним критерієм ефективності та у виборі модифікатором бази знань, що створюється попередньо експертом-фахівцем, відповідного корегуючого висловлювання, яке обробляється в контролері блоком нечіткого логічного виведення. Корекція нечіткого регулятора закінчується у момент приведення величини похибки між реакцією системи та вхідним сигналом до нульового значення. Основна проблема при використанні цього регулятора полягає в забезпеченні необхідної інтерпретивності бази знань, яка безпосередньо впливає на оперативність керування.
Рис. 1.3. Інтелектуальна СК з нечітким регулятором, що
самонастроюється (Мізумото М, Танака К, 1977 р.)
З метою розширення функціональних можливостей інтелектуальної СК С. Гупта [224] запропонував схему нечіткого регулятора, що здатний самонавчатися (рис.1.4). Основна відмінність показаного на рис. 1.4 нечіткого регулятора полягає в наявності квантифікатора, основним призначенням якого є оцінка поточного функціонального стану процесу керування та подання отриманих знань у вигляді відповіднх логічних висловлювань. У процесі функціонування СК квантифікатор залежно від показників функціонального стану процесу формує кванти знань, які співвідносяться в базі правил з відповідними правилами формування корегуючих висловлювань. Процес корекції продовжується до до тих пір, поки експертна система оцінки якості функціонування не визначить оптимальне правило. Суттєвим недоліком такої системи є наявність в контурі регулятора оператора-експерта, який повинен постійно відслідковувати процес керування.
Рис. 1.4. Інтелектуальна СК з нечітким регулятором, що
самонавчається (С. Гупта, 1996 р.)
З метою зменшення впливу експерта-оператора на процес керування О.Ю. Соколов у 1998 році у Національному аерокосмічному університеті ім. М.Є. Жуковського «Харківський авіаційний інститут» побудував лінгвістичний нечіткий регулятор, що самоорганізується, з ієрархічною структурою керування (рис. 1.5) [227]. У запропонованому О.Ю Соколовим нечіткому регуляторі, що самоорганізується, втручання оператора зводиться тільки до вибору в базі цілей необхідного цільового критерію, який реалізує алгоритм керування за відповідною таблицею лінгвістичних правил (ТЛП), що знаходяться в базі знань. Подальший розвиток лінгвістичної системи керування (рис 1.5) привів до надання нечіткому регулятору властивості навчання за енергетичним критерієм [154]. Це дозволило здійснювати синтез оптимального нечіткого регулятора із заданими перехідними характеристиками.
Рис. 1.5. Схема інтелектуального нечіткого регулятора (О.Ю. Соколов, 1998 р.)
На практиці найбільше застосування нечітких регуляторів СК, що навчаються, відбувається на базі нечітких нейронних мереж [90,145,150]. Але незавершеність в рамках різних підходів до проектування СК, що навчаються, методології побудови безпомилкових за навчальною вибіркою і оперативних класифікаторів все ще стримує впровадження здатних навчатися СК слабо формалізованими процесами за умов нечіткої компактності реалізацій образу та обмеженнх обсягів навчальної аибірки, що має місце в практичних задачах керування.
Оскільки парадигмою тенденції розвитку нечітких регуляторів інтелектуальних СК слабо формалізованими процесами є перехід від ергономічних структур до здатних навчатися (самонавчатися) регуляторів, то саме визначення нечіткого регулятора СК, що навчається, потребує уточнення.
Визначення 1.5.1. Нечітким регулятором СК, що навчається, називається електронно-обчислювальний пристрій, який здійснює фазіфікацію вхідних даних при довільних початкових умовах, побудову деяким оптимальним способом нечіткого розбиття простору ознак на класи розпізнавання, дефазіфікацію чітких керуючих висловлювань і формування відповідно їм фізичних керуючих сигналів.
Таким чином, незавершеність методології побудови безпомилкових за навчальною вибіркою і оперативних класифікаторів все ще стримує впровадження здатних навчатися СК слабо формалізованими процесами за умов нечіткої компактності реалізацій образу та обмежених обсягів навчальної вибірки, що має місце в практичних задачах керування. При цьому невирішеною центральною проблемою інформаційного синтезу СК цього класу все ще залишається оцінка функціональної ефективності навчання розпізнавати образи. На практиці найбільше застосування нечітких регуляторів СК, що навчаються, відбувається на базі нечітких нейронних мереж [90,145,150], які в рамках біонічного підходу історично першими поставили проблему високоефективного машинного навчання.
1.6. Основні висновки та постановка задачі інформаційного синтезу СК, що навчається
Порівняльний аналіз існуючих методів автоматичної класифікації та дослідження тенденції розвитку методів інформаційного синтезу СК, що навчаються, дозволяють зробити такі висновки:
Використання в задачах контролю та керування відомих параметричних і непараметричних методів автоматичної класифікації, які ґрунтуються на методах теорії статистичних рішень, становлять певну методологічну цінність, оскільки дозволяють формалізувати процес прийняття рішень, але потребують забезпечення статистичної сталості вхідних даних, що на практиці для слабо формалізованих процесів є ускладненим.
Основний недолік відомих методів автоматичної класифікації полягає в ігноруванні перетину класів розпізнавання, що має місце на практиці в задачах керування слабо формалізованими процесами. Тому останнім часом спостерігається збільшення уваги до розробки алгоритмів автоматичної класифікації у рамках теорії нечітких множин.
Переважна більшість відомих методів оптимізації навчання є непрямими, оскільки вони ґрунтуються на дистанційних критеріях і не враховують інформаційну спроможність системи, яка прямо характеризує функціональну ефективність СК, що навчається.
4. До теперішнього часу найважливіша проблема інформаційного синтезу нечітких регуляторів здатних навчатися СК оптимізація просторово-часових параметрів функціонування все ще залишається, як показує аналіз науково-технічної літератури, мало дослідженою. У працях [119,120] встановлено в рамках параметричного методу статистичної теорії прийняття рішень наближений аналітичний зв’язок оцінок точнісних характеристик системи розпізнавання з обсягами навчальної та екзаменаційної вибірок, але отримані результати так само носять модельний характер, що зменшує їх практичну цінність.
5. При обґрунтованості гіпотези нечіткої компактності реалізацій образу, яка має місце в практичних задачах контролю та керування, доцільність побудови “точної” роздільної гіперповерхні залишається сумнівною через значні обчислювальні ускладнення при її реалізації та випадковість значень ознак розпізнавання на екзамені. Тому виглядає перспективною ідея авторів праць [66,67] про доцільність у рамках детерміновано-статистичного підходу побудови статистично-усередненої наближеної до “точної” роздільної гіперповерхні спрощеної форми деяким оптимальним способом за умови забезпечення на екзамені повної достовірності розпізнавання, близької до максимальної асимптотичної, що характеризує функціональну ефективність навчання системи.
6. Оскільки машинне навчання СК є слабо формалізованим динамічним процесом оптимального керування, то його реалізація повинна ґрунтуватися на принципі дуальності О.А. Фельдбаума [223], за яким вирішальне правило корегується на кожному кроці навчання в міру накопичення емпіричних даних, що дозволяє починати навчання системи відразу ж при надходженні реалізацій різних класів за недосконалим вирішальним правилом, яке корегується в процесі навчання до безпомилкового за навчальною вибіркою.
7. Значним науковим досягненням, що має важливе методологічне та теоретичне значення для подальшого розвитку теорії автоматичної класифікації, є створення українською школою В.І.Васильєва теорії редукції [211], яка відкриває можливість побудови відносно простих вирішальних правил шляхом зменшення інформаційної надлишковості апріорного словника ознак розпізнавання.
З метою звуження проблеми будемо розглядати тільки найважливішу складову загальної ефективності функціональну ефективність навчання системи, яка характеризується інформаційною спроможністю системи. Тоді має місце така постановка задачі загального інформаційного синтезу СК, що навчається.
Нехай відома навчальна
матриця «об’єкт-властивість», яка
характеризує m-й
функціональний стан СК – клас розпізнавання
:
.
(1.6.1)
У
матриці (1.6.1) строка є реалізацією образу
,
де N
кількість ознак розпізнавання, а стовпчик
матриці
випадкова навчальна вибірка
,
де nобсяг
вибірки, Дано структурований вектор
просторово-часових параметрів
функціонування g=<g1,
…, g
,
…,
>,
які прямо або непрямо впливають на
функціональну ефективність СК, що
навчаються, з відповідними на них
обмеженнями R
(g1,
…,
)
.
Необхідно визначити оптимальні значення
параметрів функціонування
,
які забезпечують максимум КФЕ:
.
де Еm КФЕ процесу навчання розпізнавати реалізації класу ;
G область допустимих значень параметрів функціонування СК, що навчається.
При
цьому розв’язком
задачі часткового інформаційного
синтезу системи може бути визначення
оптимального значення, наприклад,
параметра
як
,
де
– область
допустимих значень параметра
Задача загального інформаційного синтезу СК, що навчається, потребує для її розв’язання оптимізації за КФЕ всіх параметрів функціонування системи, які впливают на її ефективність. Такі параметри можуть задаватися як тактико-технічним завданням на проектування системи (наприклад, параметри якості перехідного процесу, точності, надійності, та інші директивні параметри), так і визначатися безпосередньо розробником СК при пошуку інформаційно-технічних рішень забезпечення виконання системою поставленої задачі.
Таким чином, основною науковою проблемою дослідження є створення єдиної теоретичної основи для проектування оптимальних в інформаційному розумінні ефективних СК, що навчаються (самонавчаються), яка включає моделі, методи аналізу і синтезу нечітких регуляторів, а так само відповідні засоби інформаційної технології їх проектування та впровадження в різні галузі соціально-економічної сфери українського суспільства, а основною задачею дослідження є розробка на базі об’єктно-орієнтованої методології проектування прямого методу інформаційного синтезу здатної навчатися СК. При цьому важливого значення набуває конструювання робочих інформаційних КФЕ навчання інтелектуальної системи та розробка процедур оцінювання інформаційної спроможності системи. Крім того, розв’язання задачі інформаційного синтезу нечіткого регулятора СК, що навчається, вимагає дослідження таких важливих питань, як побудова математичних моделей інформаційних процесів автоматичної класифікації, оптимізація словника первинних і вторинних ознак розпізнавання, формування вхідного математичного опису, яке полягає в перетворенні ознак розпізнавання до прийнятного для подальшого машинного оброблення вигляду, визначення мінімального обсягу репрезентативних навчальних вибірок, організація ітераційних процедур оптимізації параметрів функціонування та дослідження їх впливу на функціональну ефективність СК, оцінка асимптотичної повної достовірності рішень, що приймаються на екзамені, та її корекція при збільшенні потужності алфавіту класів розпізнавання, встановлення зв’язку між функціональною ефективністю та показниками надійності та інше. При цьому значний науково-практичний інтерес становить прогнозування зміни функціональної ефективності СК та визначення моменту її перенавчання. Безумовно, важливе значення мають такі задачі інформаційного синтезу як структурування, фільтрація, стиснення вхідних даних, відбудовування образів, які розглядаються, наприклад, у працях [228-230], але не є об’єктом дослідження в даній дисертації.
Таким чином, метод інформаційного синтезу нечіткого регулятора СК, що навчається, повинен відповідати таким основним вимогам:
прямо та об’єктивно характеризувати функціональну ефективність СК;
бути в рамках методології аналізу даних об’єктно-орієнтованим методом проектування нечіткого регулятора СК, що навчається;
у рамках детерміновано-статистичного підходу корегувати математичний опис на вході нечіткого регулятора з метою побудови класифікатора, який забезпечує на екзамені повну достовірність рішень, наближену до максимальної асимптотичної, що визначається ефективністю навчання СК;
забезпечувати високу функціональну ефективність навчання СК при прийнятті гіпотез як чіткої, так і нечіткої компактності реалізацій образу, яка допускає перетин класів розпізнавання;
оптимізувати просторово-часові параметри функціонування нечіткого регулятора СК, що навчається, за інформаційним КФЕ;
розв’язувати задачі перспективного та нормативного прогнозування зміни функціональної ефективності та надійності СК;
бути універсальним для здатних навчатися СК різної природи.
Виходячи із загальної постановки задачі, інформаційний синтез СК, що навчається, розпадається на ряд самостійних задач, основні з яких наведено на рис. 1.6.
Перша
і друга задачі є типовими
задачами математичної статистики
[2,72].
Специфіка другої задачі полягає в тому,
що для аналізу результатів спостережень
за множиною об’єктів
з метою виявлення емпіричних
закономірностей даних розглядаються
тільки такі багатовимірні структури,
які може бути подано або у вигляді
матриць типу (1.6.1), або у вигляді матриць
відношень (попарних порівнянь) між
об’єктами. У загальному випадку матриця
(1.6.1) може бути тривимірною (наприклад,
при квантуванні значень ознак розпізнавання
у часі) і чотирьохвимірною (при квантуванні
як у часі, так і за рівнем). У матриці
відношень
елемент аk,l визначає
результат співставлення об’єктів
i
в розумінні деякого
заданого відношення: схожості
(відмінності), взаємозв’язку, переваги,
відстані та інше. Поряд з такими видами
взаємозв’язків між компонентами
багатовимірної структури даних, як
кількісні, якісні (некількісні), змішані
(різновидові) і порядкові, які досліджуються
класичними методами статистичного
аналізу, об’єктом дослідження
класифікаційного аналізу даних є,
насамперед, класифікаційний взаємозв’язок.
Саме цей тип взаємозв’язку дозволяє
розбивати досліджувану множину об’єктів
на підмножини, які знаходяться між собою
у певному відношенні еквівалентності.
Рис. 1.6. Основні типові задачі інформаційного синтезу СК,
що навчається
Третя задача оцінки функціональної ефективності СК, що навчається, пов'язана з проблемою вибору та обчислення КФЕ. До цього часу все ще відсутній єдиний підхід до вибору виду та структури КФЕ. Можна тільки виділити два основних підходи до оцінювання функціональної ефективності, один із яких базується на економічних показниках [191,192], а інший – на інформаційних [189,190,194]. Об’єднуючим є підхід, що базується на узагальненому КФЕ, який дозволяє оцінювати дві складові ефективності: інформаційну здатність системи та зведену вартість її функціонування [193]. Оскільки класифікація здійснюється за критерієм схожості, а мірою відображеної різноманітності, що має ціннісний аспект, є кількість інформації, то застосування інформаційного КФЕ системи є природним.
Ч
етверта
задача є центральною
при розв'язанні задачі інформаційного
синтезу СК, що навчається. Як параметри
функціонування інтелектуальної СК
виступають її просторово-часові
характеристики, які прямо або непрямо
впливають на точнісні характеристики
системи. Як параметри, які регулюються,
слід розглядати, в першу чергу, параметри
навчання системи, які впливають
безпосередньо на асимптотичну ефективність
її функціонування. Послідовність
оптимізації параметрів навчання
визначається планом навчання, параметри
якого теж можуть, в свою чергу, виступати
як параметри функціонування СК, що
регулюються. Взагалі, визначення
параметрів, які впливають на ефективність
функціонування інтелектуальної СК,
потребує ретельного системного аналізу
на етапі апріорного моделювання.
Розв’язок
п’ятої
задачі
пониження розмірності ознакового
простору, що аналізується, дозволяє
збільшити оперативність алгоритмів
класифікації і достовірність розпізнавання
за рахунок виключення «заважаючих»
ознак, які обумовлені впливом внутрішніх
і зовнішніх завад, як випадкових, так і
організованих, наприклад, з метою
дезінформації. Передумовою постановки
такої задачі є сильна залежність ознак
розпізнавання, їх дублювання, можливість
їх агрегатування, наприклад, шляхом
об’єднання, складання, групування та
інше, а так само їх різна інформаційна
навантаженість (інформативність).
Формальна постановка задачі пониження
розмірності ознакового простору така.
Нехай дана вхідна впорядкована вибіркова
послідовність:
,
де
– первинні ознаки,
– вторинні ознаки. Нехай задана міра
інформаційної спроможності СК –
.
Треба вибрати таку послідовність
,
де
i
,
щоб
у класі допустимих перетворень первинних
ознак
.
У випадку
розв’язок цієї задачі є неоптимальним
в інформаційному розумінні.
Пониження розмірності ознакового простору Ω може здійснюватися з наступною метою:
суттєве стиснення обсягів інформації для підвищення оперативності обробки та ємкості її зберігання;
відбір інформативних, вилучення неінформативних і «заважаючих» ознак та визначення латентних ознак розпізнавання.
Шоста
задача
інформаційного синтезу СК, що навчається,
полягає в проведенні розвідувального
аналізу, який набуває особливої ваги,
коли навчальна матриця
є апріорно некласифікованою, що має
місце в задачах кластерного аналізу.
Суть методів розвідувального аналізу
полягає у перевірці статистичної
сталості та статистичної однорідності
вхідних даних з метою виявлення при
заданому рівні довіри моменту переходу
функціонального стану СК, що спостерігається,
в інший. При цьому сучасна комп’ютерна
графіка надає можливість візуалізації
даних в інтерактивному режимі та з
високою оперативністю.
Сьома
задача
набуває важливого значення при
класифікаційному аналізі СК, що
навчається, з відкритим алфавітом класів
розпізнавання
,
який поповнюється або в процесі навчання,
або при виявленні нових класів як це
має місце при кластер-аналізі. Особливість
цієї задачі полягає в тому, що її
розв‘язання дозволяє не тільки оцінювати
точнісні характеристики процесу
навчання, які визначають асимптотичну
ефективність СК, а й безпосередньо
змінювати алгоритм навчання з метою
цілеспрямованого збільшення інформаційної
надлишковості вибіркових послідовностей
по мірі введення в алфавіт нових класів.
Розв‘язання цієї задачі, насамперед,
тісно пов‘язано із застосуванням
методів та ідей теорії завадозахищеного
кодування [230,231]. Крім того, для здобуття
оцінок допустимих співвідношень між
геометричними параметрами контейнерів
класів розпізнавання та розмірністю
простору ознак важливого значення
набуває розробка теорії упакування
такого простору контейнерами різної
геометричної форми.
Розв’язання
восьмої
задачі
спрямовано на підтримку функціональної
ефективності СКУ на належному рівні.
Поряд з постановкою задачі перспективного
прогнозування зміни функціональної
ефективності (інформаційної спроможності)
системи так само актуальною є постановка
задачі нормативного прогнозування з
метою, наприклад, визначення моменту
перенавчання СК. Необхідність перенавчання
СК обумовлена дрейфом у часі та в просторі
ознак вершин випадкових векторів –
реалізацій образів при незмінних
геометричних параметрах контейнерів
відповідних класів. Один з можливих
шляхів розв‘язання цієї задачі полягає
у конструюванні прогнозуючої функції
у вигляді одновимірної порядкової
статистики, яка чутлива до виходу значень
ознак розпізнавання за межі своїх
контрольних допусків. Тоді прогнозування
моменту перенавчання СК може здійснюватися
через оцінку виходу поточної статистики
,
що обчислюється на екзамені, за межі
системи довірчих інтервалів для значення
відповідної екстремальної порядкової
статистики
,
що обчислюється на етапі прогностичного
навчання.
Оскільки зміна функціонального стану СК призводить до зміни її точнісних характеристик, то взагалі мова тут може йти про зміну інформаційної спроможності системи, яка оцінюється усередненим значенням КФЕ, який є часовою функцією. Тоді, в загальному випадку, умовою перенавчання СК є виконання співвідношення
,
де
допустиме мінімальне усереднене значення
КФЕ навчання СК.
Досягнення мети даної дисертаційної роботи пов’язано у відповідному обсязі з дослідженням та розв’язанням наведених на рис 1.6 основних задач інформаційного синтезу СК, що навчається. Безумовно, кількість типових задач класифікаційного аналізу даних, наведених вище, не є повною і вони знаходять висвітлення в сучасній літературі, присвяченій проблемам розробки та застосування методів комп’ютерної класифікації в задачах контролю та керування, наприклад, у працях [68,96,123].
Основні положення і результати першого розділу відбито в монографії автора [1] і в навчальному посібнику [2]. У працях автора [8,32,33,36,39] наведено постановки задач як загального, так і часткового інформаційного синтезу СК, що навчаються.