
- •5.4. Висновки 182
- •1.1. Основні означення менеджменту знань
- •1.1.1. Структура менеджменту знань
- •Маркетинґ Проектування Підготовка виробництва Виробництво Збут.
- •1.1.2. Формування знань
- •1.1.3. Введення даних
- •1.1.4. Адміністрування
- •1.1.5. Мотивація
- •1.1.6. Особливості впровадження мз
- •1.2. Менеджмент знань
- •1.3. Базові поняття менеджменту знань
- •1.3.1. Видобування знань
- •1.3.2. Системи пізнання
- •1.3.3. Організація доступу до знань
- •1.3.4. Інновації в області автоматизації
- •1.3.5. Менеджмент знань та інформації
- •1.3.6. Менеджмент знань та Інтернет
- •1.4. Онтологічний інжиніринґ
- •1.4.1. Системи керування знаннями
- •1.4.2. Онтологія
- •1.5. Висновки
- •9. Базові поняття менеджменту знань.
- •2.1. Поле знань
- •2.1.1. Мова опису поля знань
- •2.1.3. «Піраміда» знань
- •2.2. Стратегії одержання знань
- •2.3. Теоретичні аспекти видобування знань
- •2.3.1. Психологічний аспект
- •2.3.2. Лінгвістичний аспект
- •2.3.3. Гносеологічний аспект видобування знань
- •2.4. Теоретичні аспекти структурування знань
- •2.4.1. Історична довідка
- •2.4.2. Ієрархічний підхід
- •2.4.3. Традиційні методології структуризації
- •2.4.4. Об'єктно-структурний підхід (осп)
- •3.1. Класифікація методів практичного видобування знань
- •3.2. Комунікативні методи
- •3.2.1. Пасивні методи
- •3.2.2. Активні індивідуальні методи
- •3.2.3. Активні групові методи
- •3.3. Текстологічні методи
- •3.3.1. Методи структурування
- •3.3.2. Еволюція систем одержання знань
- •4.1. Латентні структури знань і психосемантика
- •4.1.1. Семантичні простори і психологічне градуювання
- •4.1.2. Методи багатовимірного градуювання
- •4.1.3. Використання метафор для виявлення «прихованих» структур знань
- •4.2. Метод репертуарних решіток
- •4.2.1. Основні поняття
- •4.2.2. Методи виявлення конструктів. Метод мінімального контексту
- •4.2.3. Аналіз репертуарних решіток
- •4.2.4. Автоматизовані методи
- •4.3. Керування знаннями
- •4.3.1. Що таке «керування знаннями»?
- •4.3.2. Керування знаннями і корпоративна пам'ять
- •4.3.3. Системи omis
- •4.3.4. Особливості розроблення омis
- •4.4. Візуальне проектування баз знань як інструмент пізнання
- •4.4.1. Від понятійних карт до семантичних мереж
- •4.4.2. База знань як пізнавальний інструмент
- •4.5. Проектування гіпермедіа бд і адаптивних навчальних систем
- •4.5.1. Гіпертекстові системи
- •4.5.2. Від мультимедіа до гіпермедіа
- •4.5.3. На шляху до адаптивних навчальних систем
- •5.1. Важливість правильної класифікації
- •5.1.1. Класифікація й об’єктно-орієнтовне проектування
- •5.1.2. Труднощі класифікації
- •5.2. Ідентифікація класів і об'єктів
- •5.2.1. Класичний і сучасний підходи
- •5.2.2. Об’єктно-орієнтований аналіз
- •5.3. Ключові абстракції й механізми
- •5.3.1. Ключові абстракції
- •5.3.2. Ідентифікація механізмів
- •5.4. Висновки
- •6.1. Поняття онтології
- •6.2. Моделі онтології й онтологічної системи
- •6.3. Методології створення і «життєвий цикл» онтології
- •6.4. Мови опису онтологій
- •6.4.1. Види owl
- •6.4.2. Структура онтологій
- •7.1. Онтологія як засіб формалізації та алгоритмізації знань в інтелектуальній системі
- •7.1.1. Аналіз підходів до навчання онтологій
- •7.1.2. Загальні принципи проектування онтологій
- •7.1.3. Формати та стандарти подання інформації
- •7.1.4. Засоби для створення онтології
- •7.2. Технологія розроблення онтологій в редакторі Protégé
- •7.2.1. Еволюція Protégé
- •7.2.2. Protégé-owl. Мова Web онтологій owl
- •7.2.3. Основні терміни та поняття у Protégé-owl
- •7.2.4. Методика розроблення онтології засобами Protégé
- •Створення й експлуатація онтології
- •7.2.5. Створення онтології
3.3.2. Еволюція систем одержання знань
Перше покоління таких систем появилося в середині 80-х років XX ст. — це так звані системи одержання знань (СОЗ). Це засіб наповнення так званих „порожніх” ЕС, тобто систем, з БЗ яких вилучені знання (наприклад, EMYCIN — EMPTY MYCIN, спустошена медична ЕС MYCIN зі спеціальною діалоговою системою заповнення бази знань TEIRESIAS). Їхні автори вважали, що прямий діалог експерта з комп’ютером через СОЗ допоможе скоротити життєвий цикл розроблення. Однак досвід створення та впровадження СОЗ продемонстрував недосконалість такого підходу. Основні недоліки СОЗ першого покоління:
слабке опрацювання методів вилучення та структурування знань;
жорсткість моделі подання знань, вбудованої в СОЗ і прив'язаної до програмної реалізації;
обмеження на предметну область.
Отже, традиційна схема розроблення СОЗ I-го покоління (створення конкретної ЕС спустошення БЗ розроблення СОЗ для нових наповнень БЗ формування нової БЗ для іншої ЕС) виявилась непридатною для промислового застосування.
Друге покоління СОЗ з'явилося наприкінці 80-х років минулого століття і було орієнтоване на ширший модельний підхід з наголосом на попередньому детальному аналізі предметної області. Так, в Європі широке застосування одержала методологія KADS (Knowledge Acquisition and Documentation Structuring), в основі якої лежить поняття інтерпретаційної моделі, яка дозволяє процеси вилучення, структурування та формалізації знань розглядати як «інтерпретацію» лінгвістичних знань в інші подання та структури.
KADS-методологія
Рис. 3.9 демонструє перетворення знань за методологією KADS через специфікацію п'ятьох кроків аналізу «ідентифікація — концептуалізація — гносеологічний рівень — рівень аналізу виконання» та стадії чи простору проектування. Результатом аналізу є концептуальна модель експертизи, що складається з чотирьох рівнів (рівня області — рівня виведення — рівня задачі — стратегічного рівня), яка згодом вводиться в простір проектування. При розв'язуванні реальних задач KADS використовує бібліотеку інтерпретаційних моделей, що описують загальні експертні задачі, такі як діагностика, моніторинґ та ін., без конкретного наповнення об'єктами предметної області. Інтерпретаційна модель являє собою концептуальну модель без рівня області. На основі вилучених лінгвістичних даних відбувається відбір, комбінація та вкладення верхніх рівнів моделі, тобто рівнів виведення та задачі, які наповнюються конкретними об'єктами й атрибутами з рівня області та відображають у результаті концептуальну модель задачі, яку розглядають. На рис. 3.9 подана модель життєвого циклу KADS.
Рис. 3.9. Модель життєвого циклу KADS.
Перші системи програмної підтримки KADS-методології зображені набором інструментальних засобів KADS Роwer Tools. У цей набір входять наступні системи: редактор протоколів РЕD (Ргоtocol Editor); редактор систем понять (Соnсерt Editor); редактор концептуальних моделей СМЕ (Соnсерtual Моdel Еditог) та ІМ-бібліотекар IML (Interpretation Model Librarian).
Редактор протоколів — програмний засіб, що допомагає інженеру зі знань у здійсненні аналізу знань про предметну область на лінґвістичному рівні. При роботі зі знаннями на цьому рівні вихідним матеріалом є тексти (протоколи) — записи інтерв'ю з експертом, протоколи «думок вголос» та будь-які інші тексти, корисні з точки зору інженера зі знань. Редактор протоколів реалізований як гіпертекстова система, що забезпечує виділення фрагментів у тексті, який аналізують, встановлення зв'язків між фрагментами, групування фрагментів, анотування фрагментів. Фрагменти можуть мати будь-яку довжину — від окремого слова до протоколу в цілому.
Рис. 3.10. Основні моделі KADS
Фрагменти можуть не перекривати один одного. Можливі наступні типи зв'язків між фрагментами:
анотація (зв'язок між фрагментом протоколу та деяким текстом, введеним інженером зі знань для специфікації цього фрагменту);
член групи (зв'язок між фрагментом та назвою — ім'ям групи фрагментів; об'єднання фрагментів у групу дозволяє інженеру зі знань структурувати протоколи. При цьому група фрагментів одержує унікальне ім'я);
поіменований зв'язок (зв'язок між двома фрагментами, ім'я зв'язку обирає інженер зі знань);
понятійний зв'язок (поіменований зв'язок між фрагментом та поняттям, зазвичай використовується, якщо фрагмент містить визначення понять).
Редактор понять допомагає інженеру зі знань організувати предметні знання у вигляді набору понять і відношень, що їх поєднують. Кожне поняття має ім'я і може мати атрибути; кожен атрибут може мати значення. Які атрибути використовуються — це визначає інженер зі знань із врахуванням специфіки предметної області. За допомогою редактора понять інженер зі знань може вводити довільні відношення між поняттями і створювати ієрархічні структури з того чи іншого поняття. Існує єдине відношення (IS-A), семантика якого «вбудована» в редактор. Якщо інженер зі знань встановлює це відношення між двома поняттями, то має місце успадкування атрибутів. Обравши атрибут «визначення», користувач зможе побачити на екрані графічне зображення структури виведення, елементами якої є джерела знань та метакласи. Як джерела знань, так і метакласи мають свої набори атрибутів; інженер зі знань може переглянути їх, вказуючи на відповідний елемент.
Психосемантика
Окрім ідеології KADS, на розроблення СОЗ II-го покоління значний вплив мали методи суміжних наук, зокрема психосемантики, одного з молодих напрямів прикладної психології, перспективного інструменту, що дозволяє реконструктурувати семантичний простір у пам'яті і тим самим моделювати глибинні структури знань експерта (див. наступний розділ). Уже перші вклади психосемантики в ШІ в середині 80-х років XX ст. дозволили одержати достатньо наглядні результати. У подальшому розвиток цих методів відбувався по лінії розроблення зручних пакетів прикладних програм, основаних на методах багатомірного шкалювання, факторного аналізу, а також спеціалізованих методів опрацювання репертуарних решіток (див. наступний розділ). Прикладами СОЗ такого типу є системи КЕLLY, MEDIS. Специфіка конкретних додатків вимагала розвитку також «нечисельних» методів, які використовують парадигму логічного виведення. Прикладами систем цього напряму є системи ЕТS і AQUINAS. Успіхи СОЗ II-го покоління дозволили значно розширити ринок ЕС, який до кінця 80-х років XX ст. оцінювався в 300 млн. доларів на рік. Тим не менше і ці системи не були вільними від недоліків, до найважливіших з яких можна віднести:
недосконалість інтерфейсу, в результаті чого непідготовлені експерти не можуть оволодіти системою і відмовляються від неї;
важкість налаштування на конкретне професійне мовне середовище;
необхідність розроблення дорогих лінгвістичних процесорів для аналізу звичайних-мовних повідомлень та текстів.
Третє покоління СОЗ — КЕАТS, МАСАО, NЕХРЕRТ-ОВJЕСТ — перенесло акцент у проектуванні з експерта на інженера зі знань. Нові СОЗ — це програмні засоби для аналітика, глибокі, а головне такі, що використовують графічні можливості сучасних робочих станцій та досягнення САSЕ-технологій (Соmputer-Aided Software Engineering). Ці системи дозволяють не задавати заздалегідь інтерпретаційну модель, а формувати структуру БЗ динамічно. Існують різні класифікації СОЗ — за виразністю та потужністю інструментальних засобів; за узагальненими характеристиками; в межах структурно-функціонального підходу.
Методологічні проблеми
Основна проблема, що постає перед розробниками, — відсутність теоретичного базису процесу вилучення та структурування знань — породжує дочірні вужчі питання та казуси на всіх етапах створення інтелектуальних систем. Навіть ретельно опрацьована методологія KADS, описана в попередньому розділі, страждає громіздкістю та явною надмірністю. Нижче перелічені найбільш загальні проблеми, що виникають в послідовності, яка відповідає стадіям життєвого циклу:
розмитість критеріїв вибору задачі;
слабке опрацювання теоретичних аспектів процесів вилучення знань (філософські, лінгвістичні, психологічні, педагогічні, дидактичні та інші аспекти), а також відсутність обґрунтованої класифікації методів вилучення знань та розкиданість термінології;
відсутність єдиного теоретичного базису процедури структурування знань;
жорсткість моделей подання знань, що змушує розробників зменшувати та урізати реальні знання експертів;
недосконалість математичного базису моделей подання знань (дескриптивний, а не конструктивний характер більшості наявних математичних моделей);
емпіричність процедури вибору програмного інструментарію та процесу тестування (відсутність критеріїв, розрізнені класифікації), тестування (відсутність критеріїв, різноманітність класифікації тощо).
Технологічні проблеми
Більша частина технологічних проблем є звичайним наслідком методологічних і спричинена ними. Найсерйознішими з технологічних проблем є:
відсутність концептуальної цілісності та узгодженості між окремими прийомами та методами інженерії знань;
недостатність чи відсутність кваліфікованих спеціалістів у галузі інженерії знань;
відсутність техніко-економічних показників оцінки ефективності ЕС;
явна неповнота та недостатність наявних методів структурування знань, відсутність класифікацій та рекомендацій з вибору належного методу;
незважаючи на багатство ринку програмних засобів, недостатність промислових систем підтримки розроблення та їх вузька спрямованість (залежність від платформи, мови реалізації, обмежень предметної області), розрив між мовами ПЗ та мовами, вбудованими в «оболонки» ЕС;
жорсткість програмних методів, їх низька адаптивність, відсутність індивідуальної спрямованості на користувача та предметну область;
слабкі графічні можливості програмних засобів, недостатнє врахування когнітивних та ергономічних факторів.
Запитання для повторення та контролю знань
1. Як класифікуються методи практичного видобування знань?
2. Який основний принцип поділу методів практичного видобування знань?
3. Які методи видобування знань називаються комунікативними?
4. На які дві групи можна поділити комунікативні методи?
5. Які методи видобування знань називаються ігровими?
6. Як класифікуються предметні області з точки зору їх документованості?
7. Як класифікуються предметні області за ступенем структурованості знань?
8. Які методи видобування знань належать до пасивних?
9. Які методи видобування знань належать до індивідуальних активних?
10. Які існують різновиди методу спостережень?
11. Які виникають труднощі під час складання протоколу «думок вголос»?
12. Як діляться питання під час читання лекцій?
13. Обґрунтуйте порівняльні характеристики пасивних методів видобування знань.
14. Які існують способи здійснення анкетування?
15. Які рекомендації під час складання анкет?
16. Що розуміють під інтерв'ю?
17. Як відбувається класифікація запитань під час інтерв'ю?
18. Що таке вільний діалог?
19. Які стадії видобування знань під час вільного діалогу?
20. Як і порівняльні характеристики активних індивідуальних методів видобування знань?
21. Які методи видобування знань належать до групових активних?
22. Які переваги групових методів?
23. У чому полягає метод «мозкової атаки»?
24. Обґрунтуйте порівняння активних групових методів видобування знань.
25. У чому полягає метод експертної гри? Наведіть приклади.
26. У чому полягає метод рольових ігор? Наведіть приклади.
27. У чому полягає метод ігор з тренажерами? Наведіть приклади.
28. У чому полягає метод комп'ютерних експертних ігор? Наведіть приклади.
29. Які методи видобування знань належать до текстологічних?
30. Сформуйте задачу видобування знань з текстів.
31. Яка схема видобування знань зі спеціальних текстів?
32. Які компоненти наукового тексту?
33. Що таке мікроконтекст та макроконтекст?
34. Що таке основні моменти розуміння тексту?
35. Що таке семантична структура тексту?
36. Які компоненти впливають на інтерпретацію тексту?
37. Які Ви знаєте методи виявлення понять?
38. Як діляться методи виявлення зв'язків між поняттями?
39. Які існують методи виділення метапонять та деталізації понять?
40. Наведіть еволюцію систем одержання знань.
41. Що таке КADS-методологія?
42. Які основні моделі КADS?
43. Які існують типи зв'язків між фрагментами?
44. Що таке психосемантика?
45. Які існують методологічні проблеми КADS?
46. Які існують технологічні проблеми КADS?
Завдання для самостійного розв’язування
Чому задача придбання знань є вузьким місцем в проектуванні інтелектуальних систем? Які рішення пропонуються для запобігання такої ситуації?
РОЗДІЛ 4
ПРИКЛАДНІ АСПЕКТИ менеджменту та ІНЖЕНЕРІЇ ЗНАНЬ
Латентні структури знань і психосемантика
Метод репертуарних решіток
Керування знаннями
Візуальне проектування баз знань як інструмент пізнання
Проектування адаптивних навчальних систем
У розділі розглядаються прикладні аспекти інженерії знань, використання латентних структур знань та психосемантики для видобування глибинних знань. Розглянуто метод репертуарних решіток, керування знаннями та проектування бази знань. В кінці розділу описано використання адаптивних навчальних систем та їх проектування.