Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
100587_Lytvyn.doc
Скачиваний:
164
Добавлен:
07.02.2016
Размер:
6.01 Mб
Скачать

3.3.2. Еволюція систем одержання знань

Перше покоління таких систем з’явилося в середині 80-х років XX ст. – системи одержання знань (СОЗ). Це засіб наповнення “по­рожніх” ЕС, тобто систем, з БЗ яких вилучені знання (наприклад, EMYCIN – EMPTY MYCIN, спустошена медична ЕС MYCIN зі спе­ціаль­ною діалоговою системою заповнення бази знань TEIRESIAS). Їхні автори вважали, що прямий діалог експерта з комп’ютером через СОЗ допоможе скоротити життєвий цикл розроблення. Однак досвід створення та впровадження СОЗ засвідчив недосконалість такого під­ходу. Основні недоліки СОЗ першого покоління:

  • слабке опрацювання методів вилучення та структурування знань;

  • жорсткість моделі подання знань, вбудованої в СОЗ і прив’язаної до програмної реалізації;

  • обмеження на предметну область.

Отже, традиційна схема розроблення СОЗ I покоління (ство­рення конкретної ЕС  спустошення БЗ  розроблення СОЗ для нових наповнень БЗ  формування нової БЗ для іншої ЕС) ви­явилась непридатною для промислового застосування.

Друге покоління СОЗ з’явилося наприкінці 80-х років минулого століття і було орієнтоване на ширший модельний підхід з наголосом на попередньому детальному аналізі предметної області. Так, у Європі широке застосування одер­жала методологія KADS (Knowledge Acquisition and Documentation Structuring), в основі якої лежить по­няття інтерпретаційної моделі, яка дає змогу процеси вилучення, структурування та формалізації знань розглядати як “інтер­претацію” лінгвістичних знань в інші подання та структури.

KADS-методологія

Рис. 3.9 демонструє перетворення знань за методологією KADS через специфікацію п’ятьох кроків аналізу “іден­тифікація – концепту­алізація – гносеологічний рівень – рівень аналізу виконання” та стадії чи простору проектуван­ня. Результатом аналізу є концептуальна модель експертизи, що складається з чотирьох рівнів (рівня області – рівня виве­дення – рівня задачі – стратегічного рівня), яка згодом вво­диться в простір проектування. Розв’язуючи реальні задачі KADS використовує бібліотеку інтерпретаційних моде­лей, що описують загальні експертні задачі, такі як діагности­ка, моніторинг тощо, без конкретного наповнення об’єктами предметної області. Інтерпре­таційна модель – це концептуальна модель без рівня області. На основі вилучених лінгвістичних даних відбувається відбір, комбінація та вкла­дення верхніх рівнів моделі, тобто рівнів виведення та задачі, які наповнюються конкретними об’єктами й атрибутами з рівня області, та відображають у результаті концептуальну модель задачі, яку розглядають. На рис. 3.9 подано модель життєвого циклу KADS.

Рис. 3.9. Модель життєвого циклу KADS

Перші системи програмної підтримки KADS-методології зобра­жені на­бором інструментальних засобів KADS Роwer Tools. У цей набір входять такі системи: редактор протоколів РЕD (Ргоtocol Editor); редактор систем понять (Соnсерt Editor); редактор концепту­альних моделей СМЕ (Соnсерtual Моdel Еditог) та ІМ-бібліотекар IML (Interpretation Model Librarian).

Редактор протоколів – програмний засіб, що допомагає інже­неру зі знань у здійсненні аналізу знань про предметну об­ласть на лінгвістичному рівні. Працюючи зі знаннями на цьо­му рівні, вихідним матеріалом є тексти (протоколи) – записи інтерв’ю з експертом, протоколи “думок вголос” та будь-які інші тексти, корисні з погляду інженера зі знань. Редактор протоколів реалізований як гіпертекстова система, що забез­печує виділення фрагментів у тексті, який аналізують, вста­новлення зв’язків між фрагментами, групування фраг­ментів, анотування фрагментів. Фрагменти можуть мати будь-яку довжину – від окремого слова до протоколу.

Рис. 3.10. Основні моделі KADS

Фрагменти можуть не перекривати один одного. Можливі такі типи зв’язків між фрагментами:

  • анотація (зв’язок між фрагментом протоколу та деяким текстом, введеним інженером зі знань для специфікації цього фрагмента);

  • член групи (зв’язок між фрагментом та назвою – ім’ям групи фрагментів; об’єднання фрагментів у групу дає змогу інженеру зі знань структурувати протоколи. Група фрагментів одержує уні­кальну назхву);

  • поіменований звязок (зв’язок між двома фрагментами, ім’я зв’язку обирає інженер зі знань);

  • понятійний звязок (поіменований зв’язок між фрагмен­том та по­няттям, зазвичай використовується, якщо фрагмент містить виз­начення понять).

Редактор понять допомагає інженеру зі знань організува­ти предметні знання у вигляді набору понять і відношень, що їх поєд­нують. Кожне поняття має назву і може мати атрибути; кожен атрибут може мати значення. Які атрибути використо­вуються – це визначає інженер зі знань із урахуванням спе­цифіки предметної області. За допомогою редактора понять інженер зі знань може вводити довільні відношення між по­няттями і створювати ієрархічні структури з того чи іншого поняття. Існує єдине відношення (IS-A), семантика якого “вбу­дована” в редактор. Якщо інженер зі знань встановлює це відношення між двома поняттями, то має місце успадкування атрибутів. Обравши атрибут “визначення”, користувач зможе побачити на екрані графічне зображення структури виведен­ня, елементами якої є джерела знань та метакласи. Як джере­ла знань, так і метакласи мають свої набори атри­бутів; інже­нер зі знань може переглянути їх, вказуючи на відповідний елемент.

Психосемантика

Окрім ідеології KADS, на розроблення СОЗ II-го покоління значний вплив мали методи суміжних наук, зокрема психосе­мантики, одного з молодих напрямів прикладної психології, перспективного інструменту, що дає змогу реконструктурувати семантичний простір у пам’яті і тим самим моделю­вати глибинні структури знань експерта (див. наступний розділ). Уже перші вклади психосемантики в ШІ в середині 80-х років XX ст. дали змогу одержати достатньо наглядні ре­зультати. У подальшому розвиток цих методів відбувався по лінії роз­роб­лення зручних пакетів прикладних програм, ос­нованих на методах багатомірного шкалювання, факторного аналізу, а також спеціалі­зованих методів опрацювання репер­туарних решіток (див. наступний розділ). Прикладами СОЗ такого типу є системи КЕLLY, MEDIS. Специфіка конкретних додатків вимагала розвитку також “нечисель­них” методів, які використовують парадигму логічного виве­дення. Прик­ладами систем цього напряму є системи ЕТS і AQUINAS. Успіхи СОЗ II-го покоління дали змогу знач­но розширити ринок ЕС, який до кінця 80-х років XX ст. оцінювався в 300 млн. доларів на рік. Однак і ці системи не були вільними від недоліків, до найважливіших з яких можна зарахувати:

  • недосконалість інтерфейсу, в результаті чого непідготовлені експерти не можуть оволодіти системою і відмовляються від неї;

  • важкість налаштування на конкретне професійне мовне середовище;

  • необхідність розроблення дорогих лінгвістичних проце­сорів для аналізу звичайних мовних повідомлень та текстів.

Третє покоління СОЗ – КЕАТS, МАСАО, NЕХРЕRТ-ОВJЕСТ – перенес­ло акцент у проектуванні з експерта на інженера зі знань. Нові СОЗ – це програмні засоби для аналітика, глибокі, а головне такі, що використовують графічні можливості сучасних робочих станцій та досягнення САSЕ-технологій (Соmputer-Aided Software Engineering). Ці системи дають змогу не задавати заздалегідь інтерпретаційну мо­дель, а формувати структуру БЗ динамічно. Існують різні класифікації СОЗ – за виразністю та потужністю інструментальних засобів; за узагальненими характеристиками; в межах структурно-функціо­нального підходу.

Методологічні проблеми

Основна проблема, що постає перед розробниками, – відсутність теоретичного базису процесу вилучення та структурування знань – породжує дочірні вужчі питання та казуси на всіх етапах створення інтелектуальних систем. Навіть ре­тельно опрацьована методологія KADS, описана в попередньо­му розділі, страждає громіздкістю та явною надмірністю. Нижче перелічені найзагальніші проблеми, що виникають в послідовності, яка відповідає стадіям життєвого циклу:

  • розмитість критеріїв вибору задачі;

  • слабке опрацювання теоретичних аспектів процесів вилу­чення знань (філософські, лінгвістичні, психологічні, педа­гогічні, дидак­тичні та інші аспекти), а також відсутність обґрунтованої класифі­кації методів вилучення знань та розки­даність термінології;

  • відсутність єдиного теоретичного базису процедури структуру­вання знань;

  • жорсткість моделей подання знань, що змушує розроб­ників змен­шувати та урізати реальні знання експертів;

  • недосконалість математичного базису моделей подання знань (де­скриптивний, а не конструктивний характер біль­шості наявних мате­матичних моделей);

  • емпіричність процедури вибору програмного інструмен­тарію та процесу тестування (відсутність критеріїв, розрізнені класифікації), тестування (відсутність критеріїв, різноманіт­ність класифікації тощо).

Технологічні проблеми

Більша частина технологічних проблем є звичайним наслідком мето­дологічних і спричинена ними. Найсерйозні­шими з технологічних проблем є:

  • відсутність концептуальної цілісності та узгодженості між окре­мими прийомами та методами інженерії знань;

  • недостатність чи відсутність кваліфікованих спеціалістів у галузі інженерії знань;

  • відсутність техніко-економічних показників оцінки ефективності ЕС;

  • явна неповнота та недостатність наявних методів структурування знань, відсутність класифікацій та рекомендацій з вибору належ­ного методу;

  • незважаючи на багатство ринку програмних засобів, не­достатність промислових систем підтримки розроблення та їх вузька спрямо­ваність (залежність від платформи, мови реалі­зації, обмежень пред­метної області), розрив між мовами ПЗ та мовами, вбудованими в “оболонки” ЕС;

  • жорсткість програмних методів, їх низька адаптивність, відсутність індивідуальної спрямованості на користувача та предметну область;

  • слабкі графічні можливості програмних засобів, недо­статнє враху­вання когнітивних та ергономічних факторів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]