Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
підручник Менеджмент знань.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
6 Mб
Скачать

3.3.2. Еволюція систем одержання знань

Перше покоління таких систем появилося в середині 80-х років XX ст. — це так звані системи одержання знань (СОЗ). Це засіб наповнення так званих „порожніх” ЕС, тобто систем, з БЗ яких вилучені знання (наприклад, EMYCIN — EMPTY MYCIN, спустошена медична ЕС MYCIN зі спеціальною діалоговою системою заповнення бази знань TEIRESIAS). Їхні автори вважали, що прямий діалог експерта з комп’ютером через СОЗ допоможе скоротити життєвий цикл розроблення. Однак досвід створення та впровадження СОЗ продемонстрував недосконалість такого підходу. Основні недоліки СОЗ першого покоління:

  • слабке опрацювання методів вилучення та структурування знань;

  • жорсткість моделі подання знань, вбудованої в СОЗ і прив'язаної до програмної реалізації;

  • обмеження на предметну область.

Отже, традиційна схема розроблення СОЗ I-го покоління (створення конкретної ЕС  спустошення БЗ  розроблення СОЗ для нових наповнень БЗ  формування нової БЗ для іншої ЕС) ви­явилась непридатною для промислового застосування.

Друге покоління СОЗ з'явилося наприкінці 80-х років минулого століття і було орієнтоване на ширший модельний підхід з наголосом на попередньому детальному аналізі предметної області. Так, в Європі широке застосування одер­жала методологія KADS (Knowledge Acquisition and Documentation Structuring), в основі якої лежить поняття інтерпретаційної моделі, яка дозволяє процеси вилучення, структурування та формалізації знань розглядати як «інтер­претацію» лінгвістичних знань в інші подання та структури.

KADS-методологія

Рис. 3.9 демонструє перетворення знань за методологією KADS через специфікацію п'ятьох кроків аналізу «іден­тифікація — концептуалізація — гносеологічний рівень — рівень аналізу виконання» та стадії чи простору проектуван­ня. Результатом аналізу є концептуальна модель експертизи, що складається з чотирьох рівнів (рівня області — рівня виве­дення — рівня задачі — стратегічного рівня), яка згодом вво­диться в простір проектування. При розв'язуванні реальних задач KADS використовує бібліотеку інтерпретаційних моде­лей, що описують загальні експертні задачі, такі як діагности­ка, моніторинґ та ін., без конкретного наповнення об'єктами предметної області. Інтерпретаційна модель являє собою концептуальну модель без рівня області. На основі вилучених лінгвістичних даних відбувається відбір, комбінація та вкла­дення верхніх рівнів моделі, тобто рівнів виведення та задачі, які наповнюються конкретними об'єктами й атрибутами з рівня області та відображають у результаті концептуальну модель задачі, яку розглядають. На рис. 3.9 подана модель життєвого циклу KADS.

Рис. 3.9. Модель життєвого циклу KADS.

Перші системи програмної підтримки KADS-методології зображені на­бором інструментальних засобів KADS Роwer Tools. У цей набір входять наступні системи: редактор протоколів РЕD (Ргоtocol Editor); редактор систем понять (Соnсерt Editor); редактор концепту­альних моделей СМЕ (Соnсерtual Моdel Еditог) та ІМ-бібліотекар IML (Interpretation Model Librarian).

Редактор протоколів — програмний засіб, що допомагає інженеру зі знань у здійсненні аналізу знань про предметну об­ласть на лінґвістичному рівні. При роботі зі знаннями на цьо­му рівні вихідним матеріалом є тексти (протоколи) — записи інтерв'ю з експертом, протоколи «думок вголос» та будь-які інші тексти, корисні з точки зору інженера зі знань. Редактор протоколів реалізований як гіпертекстова система, що забез­печує виділення фрагментів у тексті, який аналізують, вста­новлення зв'язків між фрагментами, групування фрагментів, анотування фрагментів. Фрагменти можуть мати будь-яку довжину — від окремого слова до протоколу в цілому.

Рис. 3.10. Основні моделі KADS

Фрагменти можуть не перекривати один одного. Можливі наступні типи зв'язків між фрагментами:

  • анотація (зв'язок між фрагментом протоколу та деяким текстом, введеним інженером зі знань для специфікації цього фрагменту);

  • член групи (зв'язок між фрагментом та назвою — ім'ям групи фрагментів; об'єднання фрагментів у групу дозволяє інженеру зі знань структурувати протоколи. При цьому група фрагментів одержує унікальне ім'я);

  • поіменований зв'язок (зв'язок між двома фрагментами, ім'я зв'язку обирає інженер зі знань);

  • понятійний зв'язок (поіменований зв'язок між фрагмен­том та поняттям, зазвичай використовується, якщо фрагмент містить визначення понять).

Редактор понять допомагає інженеру зі знань організува­ти предметні знання у вигляді набору понять і відношень, що їх поєднують. Кожне поняття має ім'я і може мати атрибути; кожен атрибут може мати значення. Які атрибути використо­вуються — це визначає інженер зі знань із врахуванням спе­цифіки предметної області. За допомогою редактора понять інженер зі знань може вводити довільні відношення між по­няттями і створювати ієрархічні структури з того чи іншого поняття. Існує єдине відношення (IS-A), семантика якого «вбу­дована» в редактор. Якщо інженер зі знань встановлює це відношення між двома поняттями, то має місце успадкування атрибутів. Обравши атрибут «визначення», користувач зможе побачити на екрані графічне зображення структури виведен­ня, елементами якої є джерела знань та метакласи. Як джере­ла знань, так і метакласи мають свої набори атрибутів; інже­нер зі знань може переглянути їх, вказуючи на відповідний елемент.

Психосемантика

Окрім ідеології KADS, на розроблення СОЗ II-го покоління значний вплив мали методи суміжних наук, зокрема психосе­мантики, одного з молодих напрямів прикладної психології, перспективного інструменту, що дозволяє реконструктурувати семантичний простір у пам'яті і тим самим моделю­вати глибинні структури знань експерта (див. наступний розділ). Уже перші вклади психосемантики в ШІ в середині 80-х років XX ст. дозволили одержати достатньо наглядні ре­зультати. У подальшому розвиток цих методів відбувався по лінії розроблення зручних пакетів прикладних програм, ос­нованих на методах багатомірного шкалювання, факторного аналізу, а також спеціалізованих методів опрацювання репер­туарних решіток (див. наступний розділ). Прикладами СОЗ такого типу є системи КЕLLY, MEDIS. Специфіка конкретних додатків вимагала розвитку також «нечисельних» методів, які використовують парадигму логічного виве­дення. Прикладами систем цього напряму є системи ЕТS і AQUINAS. Успіхи СОЗ II-го покоління дозволили знач­но розширити ринок ЕС, який до кінця 80-х років XX ст. оцінювався в 300 млн. доларів на рік. Тим не менше і ці системи не були вільними від недоліків, до найважливіших з яких можна віднести:

  • недосконалість інтерфейсу, в результаті чого непідготовлені експерти не можуть оволодіти системою і відмовляються від неї;

  • важкість налаштування на конкретне професійне мовне середовище;

  • необхідність розроблення дорогих лінгвістичних проце­сорів для аналізу звичайних-мовних повідомлень та текстів.

Третє покоління СОЗ — КЕАТS, МАСАО, NЕХРЕRТ-ОВJЕСТ — перенес­ло акцент у проектуванні з експерта на інженера зі знань. Нові СОЗ — це програмні засоби для аналітика, глибокі, а головне такі, що використовують графічні можливості сучасних робочих станцій та досягнення САSЕ-технологій (Соmputer-Aided Software Engineering). Ці системи дозволяють не задавати заздалегідь інтерпретаційну модель, а формувати структуру БЗ динамічно. Існують різні класифікації СОЗ — за виразністю та потужністю інструментальних засобів; за узагальненими характеристиками; в межах структурно-функціонального підходу.

Методологічні проблеми

Основна проблема, що постає перед розробниками, — відсутність теоретичного базису процесу вилучення та структурування знань — породжує дочірні вужчі питання та казуси на всіх етапах створення інтелектуальних систем. Навіть ре­тельно опрацьована методологія KADS, описана в попередньо­му розділі, страждає громіздкістю та явною надмірністю. Нижче перелічені найбільш загальні проблеми, що виникають в послідовності, яка відповідає стадіям життєвого циклу:

  • розмитість критеріїв вибору задачі;

  • слабке опрацювання теоретичних аспектів процесів вилу­чення знань (філософські, лінгвістичні, психологічні, педа­гогічні, дидактичні та інші аспекти), а також відсутність обґрунтованої класифікації методів вилучення знань та розки­даність термінології;

  • відсутність єдиного теоретичного базису процедури структурування знань;

  • жорсткість моделей подання знань, що змушує розроб­ників зменшувати та урізати реальні знання експертів;

  • недосконалість математичного базису моделей подання знань (дескриптивний, а не конструктивний характер біль­шості наявних математичних моделей);

  • емпіричність процедури вибору програмного інструмен­тарію та процесу тестування (відсутність критеріїв, розрізнені класифікації), тестування (відсутність критеріїв, різноманіт­ність класифікації тощо).

Технологічні проблеми

Більша частина технологічних проблем є звичайним наслідком методологічних і спричинена ними. Найсерйозні­шими з технологічних проблем є:

  • відсутність концептуальної цілісності та узгодженості між окремими прийомами та методами інженерії знань;

  • недостатність чи відсутність кваліфікованих спеціалістів у галузі інженерії знань;

  • відсутність техніко-економічних показників оцінки ефективності ЕС;

  • явна неповнота та недостатність наявних методів структурування знань, відсутність класифікацій та рекомендацій з вибору належного методу;

  • незважаючи на багатство ринку програмних засобів, не­достатність промислових систем підтримки розроблення та їх вузька спрямованість (залежність від платформи, мови реалі­зації, обмежень предметної області), розрив між мовами ПЗ та мовами, вбудованими в «оболонки» ЕС;

  • жорсткість програмних методів, їх низька адаптивність, відсутність індивідуальної спрямованості на користувача та предметну область;

  • слабкі графічні можливості програмних засобів, недо­статнє врахування когнітивних та ергономічних факторів.

Запитання для повторення та контролю знань

1. Як класифікуються методи практичного видобування знань?

2. Який основний принцип поділу методів практичного ви­добування знань?

3. Які методи видобування знань називаються комуніка­тивними?

4. На які дві групи можна поділити комунікативні методи?

5. Які методи видобування знань називаються ігровими?

6. Як класифікуються предметні області з точки зору їх документованості?

7. Як класифікуються предметні області за ступенем структурованості знань?

8. Які методи видобування знань належать до пасивних?

9. Які методи видобування знань належать до індивідуаль­них активних?

10. Які існують різновиди методу спостережень?

11. Які виникають труднощі під час складання протоколу «думок вголос»?

12. Як діляться питання під час читання лекцій?

13. Обґрунтуйте порівняльні характеристики пасивних ме­тодів видобування знань.

14. Які існують способи здійснення анкетування?

15. Які рекомендації під час складання анкет?

16. Що розуміють під інтерв'ю?

17. Як відбувається класифікація запитань під час інтерв'ю?

18. Що таке вільний діалог?

19. Які стадії видобування знань під час вільного діалогу?

20. Як і порівняльні характеристики активних індивідуаль­них методів видобування знань?

21. Які методи видобування знань належать до групових ак­тивних?

22. Які переваги групових методів?

23. У чому полягає метод «мозкової атаки»?

24. Обґрунтуйте порівняння активних групових методів ви­добування знань.

25. У чому полягає метод експертної гри? Наведіть при­клади.

26. У чому полягає метод рольових ігор? Наведіть при­клади.

27. У чому полягає метод ігор з тренажерами? Наведіть приклади.

28. У чому полягає метод комп'ютерних експертних ігор? Наведіть приклади.

29. Які методи видобування знань належать до тексто­логічних?

30. Сформуйте задачу видобування знань з текстів.

31. Яка схема видобування знань зі спеціальних текстів?

32. Які компоненти наукового тексту?

33. Що таке мікроконтекст та макроконтекст?

34. Що таке основні моменти розуміння тексту?

35. Що таке семантична структура тексту?

36. Які компоненти впливають на інтерпретацію тексту?

37. Які Ви знаєте методи виявлення понять?

38. Як діляться методи виявлення зв'язків між поняттями?

39. Які існують методи виділення метапонять та деталізації понять?

40. Наведіть еволюцію систем одержання знань.

41. Що таке КADS-методологія?

42. Які основні моделі КADS?

43. Які існують типи зв'язків між фрагментами?

44. Що таке психосемантика?

45. Які існують методологічні проблеми КADS?

46. Які існують технологічні проблеми КADS?

Завдання для самостійного розв’язування

Чому задача придбання знань є вузьким місцем в проектуванні інтелектуальних систем? Які рішення пропонуються для запобігання такої ситуації?

РОЗДІЛ 4

ПРИКЛАДНІ АСПЕКТИ менеджменту та ІНЖЕНЕРІЇ ЗНАНЬ

  • Латентні структури знань і психосемантика

  • Метод репертуарних решіток

  • Керування знаннями

  • Візуальне проектування баз знань як інструмент пізнання

  • Проектування адаптивних навчальних систем

У розділі розглядаються прикладні аспекти інженерії знань, використання латентних структур знань та психосемантики для видобування глибинних знань. Розглянуто метод репертуарних решіток, керування знаннями та проектування бази знань. В кінці розділу описано використання адаптивних навчальних систем та їх проектування.