
- •5.4. Інтелектуальні системи керування з використанням нейронних мереж
- •Штучні нейронні мережі: історія проблеми
- •Моделювання нейронів мозку
- •Багатошарові персептрони
- •Інші архітектури нейронних мереж
- •Нечіткі нейронні мережі
- •Загальні принципи побудови нейромережевих систем керування динамічними об'єктами
- •Застосування нейронних мереж у задачах ідентифікації динамічних об'єктів
- •Синтез структури багаторежимного нейромережевого регулятора
- •Приклади побудови нейромережевих систем керування динамічними об'єктами
- •Програмна й апаратна реалізація нейронних мереж. Нейрокомп’ютери
5.4. Інтелектуальні системи керування з використанням нейронних мереж
Штучні нейронні мережі: історія проблеми
Поняття «нейронні мережі» з’явилось в 40-х роках XX століття у колі нейробіологів і нейроанатомів, що вивчали організацію й функціонування мозку. Основні результати були отримані ними при дослідженні структури й функцій нервової системи людини. Вони багато чого зрозуміли в «електропроводці» мозку, але мало довідалися про його функціонування. У процесі вивчення з'ясується, що мозок має приголомшуючу складність (майже 100 мільярдів нейронів й кілька трильйонів з'єднань).
Поглиблення уявлення про функціонування нейронів дало можливість дослідникам створювати різноманітні математичні моделі перевірки власних теорій. З'явилися так звані штучні нейронні мережі (НМ), що представляють собою набори елементарних нейроподібних перетворювачів інформації (нейронів), з'єднаних один з одним каналами обміну інформацією для їх спільної роботи. Всі дослідження відтепер проводилися на ЕОМ. без залучення до експериментів людини або тварин. У такий спосіб були вирішені багато практичних й морально-етичних проблем.
Існують два взаємно пов’язаних напрямки досліджень в області нейронного моделювання, що мають різні цілі:
зрозуміти функціонування нервової системи людини на рівні фізіології й психології (так званий нейробіологічний напрямок);
створити НМ, яка б виконувала функції, подібні з функціями мозку (прагматичний, або «технічний», напрямок).
Перша формальна математична модель нейрона була запропонована в 1943 р. відомим американським фізіологом Уорреном Мак-Каллоком (W. McCulloch) і його 19-річним учнем Вальтером Питтсом (W Pitts). Тоді ж ними було сформульовано фундаментальне твердження про те, що «будь-яка функція нервової системи, що може бути логічно описана за допомогою кінцевого числа слів, може бути реалізована мережею, складеної з певного числа формальних нейронів».
В 1949 р. канадським психологом Д. Хеббом (D. Hebb) була запропонована модель біологічного нейрона й правило навчання ваги його синоптичних зв'язків, що зіграли важливу роль у становленні основ теорії НМ.
В 1958 р. американський нейробіолог, професор Корнельського університету Франк Розенблатт (F. Rosenblatt), розробив і практично реалізував першу «модель мозку» у вигляді електронного нейроподібного пристрою, названого їм персептроном (від англ. Perception – «сприйняття»). Основні принципи побудови персептронів і деякі результати їх практичного застосування й теоретичних досліджень були викладені ним у виданій в 1961 р. книзі «Принципи нейродинаміки», яка відразу одержала широку популярність серед фахівців. Розенблатт винятково високо оцінив перспективи свого винаходу. Він стверджував: «Не можна сказати, що ми точно відтворили роботу людського мозку, але поки персептрон ближче всього до істини». Він говорить, що в недалекому майбутньому персептрони виявлять чудесні здібності – будуть писати під диктування, переводити з однієї мови на інші і вирішувати складні не обчислювані задачі.
І дійсно, застосування персептронів дозволило відразу ж одержати якісно нові результати при рішенні таких задач, як пророкування погоди, аналіз електрокардіограм, штучний зір. Це надало підставу думати, що ключ до розуміння інтелекту нарешті знайдено. Однак ця ілюзія досить швидко розсіялася. Професор Масачусетського технологічного інституту Марвін Мінскі (М.Minsky) і його колега, математик Сеймуз Пейперт (S. Papert). в 1969 р. випустили книгу – «Персептрони», де вони математично строго довели, що використовувані в той час одношарові НМ принципово нездатні вирішувати багато простих завдань, зокрема реалізувати логічну функцію «вилучаючого АБО». Переконливість доведених ними теорем, їх високий авторитет у науковому світі привели до того, що фактично винесений у книзі вирок (персептрони являють собою речі, «майже марні») негативно позначився на розвитку досліджень у даному напрямку через різке зниження фінансування робіт з боку урядових організацій, внаслідок чого інтерес до тематики НМ був втрачений більш ніж на 10 років.
Разом з тим, слід зазначити, що роботи в області побудови НМ і алгоритмів їх навчання в 70-і роки минулого сторіччя проводилися не тільки зусиллями окремих ентузіастів на Заході (Т. Кохонен. С. Гроссберг. Дж. Андерсон і ін.), але й у рамках широко відомих наукових шкіл у Радянському Союзі. Фундаментальні результати в цьому напрямку, що отримали світове визнання, були отримані в роботах професорів М. А. Айзермана, Е. М. Бравермана, Л. І. Розоноера, Л.З. Ципкіна, А. І. Галушкіна, А. Х. Івахненко, В. Л. Дуніна-Барковського й ряду інших вітчизняних учених, де були закладені математичні основи теорії навчання і її застосування до синтезу адаптивних нейромережевих структур. Теоретичні й прикладні дослідження проблеми НМ проводилися в ці роки також під керівництвом проф. А.В. Каляєва в НДІ Багатопроцесорних обчислювальних систем Таганрозького радіотехнічного інституту.
Помітну роль у розвитку досліджень в області нейромережевого моделювання зіграла стаття американського фізика-теоретика Джона Хопфілда (J. Hopfield) [11], що вийшла в 1982 р, у якій він описав новий клас динамічних НМ зі зворотними зв'язками, використовуваних для побудови систем асоціативної пам'яті й рішення завдань багатопараметричної оптимізації. Фінським ученим Тойво Кохоненом (Т. Kohonen) був запропонований інший важливий клас нейронних мереж, здатних самоорганізовуватись, що реалізує алгоритми навчання «без учителя», що дає додаткові переваги при рішенні завдань розпізнавання образів і кластеризації даних.
Великий резонанс викликала опублікована в 1986 р. робота американських учених Д. Румельхарта (D. Rumelhart), Дж. Хинтона (J. Hinton) і Р. Уильямса (R. Williams), у якій був викладений ефективний алгоритм настроювання ваги багатошарової НМ, названа авторами «алгоритмом зворотного поширення помилки» (Back Propagation Algorithm, ВРА). Забезпечуючи значну економію часу обчислень, цей алгоритм відразу ж одержав більшу популярність у різних додатках з використанням багатошарових персептронів. Незабаром, однак, з'ясувалося, що первісна ідея побудови алгоритму належала іншому американському вченому П. Вербосу (P. Werbos), що ще в 1974 р., використовував аналогічний алгоритм у своїй докторській дисертації.
Сплеск інтересу до НМ, що виявився в середині 80-х років минулого сторіччя, стійко зберігається й нині. Міцно узвичаїлися поняття «нейроінформатика», «нейроматематика», «нейрокібернетика». Щорічно в нашій країні й за рубежем проводиться велике число міжнародних науково-технічних конференцій, присвячених проблемам розробки й впровадження інтелектуальних нейромережевих систем. Область застосування цих систем безупинно розширюється: від медицини, фінансової діяльності й будівництва – до керування складними авіаційними й космічними об'єктами.
У нашій країні з 1992 р. видається періодичний журнал «Нейрокомп’ютери: розробка й застосування». З 2000 р. здійснюється випуск серії книг «Нейрокомп’ютери і їх застосування» під загальною редакцією проф. А.И. Галушкіна. У цей час уже видано більше 30 книг цієї серії.
Особливе місце в тематиці робіт, пов'язаних із застосуванням НМ, займають дослідження в області нейроуправління – нового розділу сучасної теорії керування нелінійними динамічними об'єктами, що вирішує завдання побудови й реалізації багаторежимних нейромережевих регуляторів. Нейроуправління – це не просте перенесення традиційних алгоритмів керування на нейромережеву елементну базу. Метою нейроуправління є вибір найбільш ефективної стратегії керування об'єктом в умовах дії факторів:
невизначеності, використовуючи для цього наступні безсумнівні достоїнства НМ;
можливість до навчання й самонавчання;
висока швидкодія (особливо у випадку їх апаратної реалізації на основі однорідних обчислювальних структур);
потенційно висока стійкість до перешкод і відмовостійкість (у силу структурної надмірності, властивій самій природі НМ);
універсальність застосування, можливість рішення погано формалізуємих завдань (розпізнавання образів, кластерний аналіз, ідентифікація, прогноз і т.п.).
Очевидно, що синтез нейромережевих систем керування вимагає розробки принципово нових підходів, що опираються на якісну теорію динамічних систем, теорію апроксимації, теорію навчання, теорію статистичної класифікації (прийняття рішень). У свою чергу, технічна реалізація нейромережевих регуляторів сьогодні все більшою мірою орієнтується на відмову від використання традиційних ЕОМ фоннеймановської архітектури й перехід до створення спеціалізованих і універсальних нейрокомп’ютерів у класі обчислювальних систем, адекватних нейромережевому логічному базису. Прогнозується, що нейрокомп’ютери вже найближчим часом перевершать інші види архітектури однопроцесорних і багатопроцесорних ЕОМ за критерієм відносини продуктивність – вартість.