- •В.В. Литвин технології менеджменту знань
- •Розділ 1 основні поняття менеджменту знань
- •1.1. Основні означення менеджменту знань
- •1.1.1. Структура менеджменту знань
- •Маркетинґ Проектування Підготовка виробництва Виробництво Збут
- •1.1.2. Формування знань
- •1.1.3. Введення даних
- •1.1.4. Адміністрування
- •1.1.5. Мотивація
- •1.1.6. Особливості впровадження мз
- •1.2. Менеджмент знань
- •1.3. Базові поняття менеджменту знань
- •1.3.1. Видобування знань
- •1.3.2. Системи пізнання
- •1.3.3. Організація доступу до знань
- •1.3.4. Інновації в області автоматизації
- •1.3.5. Менеджмент знань та інформації
- •1.3.6. Менеджмент знань та Інтернет
- •1.4. Онтологічний інжиніринг
- •1.4.1. Системи керування знаннями
- •1.4.2. Онтологія
- •1.5. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 2 теоретичні аспекти менеджменту та інженерії знань
- •2.1. Поле знань
- •2.1.1. Мова опису поля знань
- •2.1.2. Семіотична модель поля знань
- •2.1.3. “Піраміда” знань
- •2.2. Стратегії одержання знань
- •2.3. Теоретичні аспекти видобування знань
- •2.3.1. Психологічний аспект
- •2.3.2. Лінгвістичний аспект
- •2.3.3. Гносеологічний аспект видобування знань
- •2.4. Теоретичні аспекти структурування знань
- •2.4.1. Історична довідка
- •2.4.2. Ієрархічний підхід
- •2.4.3. Традиційні методології структуризації
- •2.4.4. Об’єктно-структурний підхід (осп)
- •Стратифікація знань предметної області
- •Матриця об’єктно-структурного аналізу
- •Запитання для повторення та контролю знань
- •Розділ 3 технології менеджменту та інженерії знань
- •3.1. Класифікація методів практичного видобування знань
- •3.2. Комунікативні методи
- •3.2.1. Пасивні методи
- •Порівняльні характеристики пасивних методів видобування знань
- •3.2.2. Активні індивідуальні методи
- •Порівняльні характеристики активних індивідуальних методів видобування
- •3.2.3. Активні групові методи
- •3.3. Текстологічні методи
- •3.3.1. Методи структурування
- •Дані концептуалізації
- •3.3.2. Еволюція систем одержання знань
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Розділ 4 прикладні аспекти менеджменту та інженерії знань
- •4.1. Латентні структури знань і психосемантика
- •4.1.1. Семантичні простори і психологічне градуювання
- •Опис зв’язку між поняттями
- •4.1.2. Методи багатовимірного градуювання
- •4.1.3. Використання метафор для виявлення “прихованих” структур знань
- •4.2. Метод репертуарних решіток
- •4.2.1. Основні поняття
- •4.2.2. Методи виявлення конструктів. Метод мінімального контексту
- •4.2.3. Аналіз репертуарних решіток
- •4.2.4. Автоматизовані методи
- •4.3. Керування знаннями
- •4.3.1. Що таке “керування знаннями”?
- •4.3.2. Керування знаннями і корпоративна пам’ять
- •4.3.3. Системи omis
- •4.3.4. Особливості розроблення омis
- •4.4. Візуальне проектування баз знань як інструмент пізнання
- •4.4.1. Від понятійних карт до семантичних мереж
- •4.4.2. База знань як пізнавальний інструмент
- •4.5. Проектування гіпермедіа бд і адаптивних навчальних систем
- •4.5.1. Гіпертекстові системи
- •4.5.2. Від мультимедіа до гіпермедіа
- •4.5.3. На шляху до адаптивних навчальних систем
- •Запитання для повторення та контролю знань
- •Розділ 5 Класифікація даних та знань
- •5.1. Важливість правильної класифікації
- •5.1.1. Класифікація й об’єктно-орієнтовне проектування
- •5.1.2. Труднощі класифікації
- •5.2. Ідентифікація класів і об’єктів
- •5.2.1. Класичний і сучасний підходи
- •5.2.2. Об’єктно-орієнтований аналіз
- •5.3. Ключові абстракції й механізми
- •5.3.1. Ключові абстракції
- •5.3.2. Ідентифікація механізмів
- •5.4. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 6 онтології й онтологічні системи
- •6.1. Поняття онтології
- •6.2. Моделі онтології й онтологічної системи
- •Класифікація моделей онтології
- •6.3. Методології створення і “життєвий цикл”онтології
- •6.4. Мови опису онтологій
- •6.4.1. Види owl
- •6.4.2. Структура онтологій
- •Запитання для повторення та контролю знань
- •Розділ 7 Програмні засоби побудови онтологій
- •7.1. Онтологія як засіб формалізації та алгоритмізації знань в інтелектуальній системі
- •7.1.1. Аналіз підходів до навчання онтологій
- •7.1.2. Загальні принципи проектування онтологій
- •7.1.3. Формати та стандарти подання інформації
- •7.1.4. Засоби для створення онтології
- •7.2. Технологія розроблення онтологій в редакторі Protégé
- •7.2.1. Еволюція Protégé
- •7.2.2. Protégé-owl. Мова Web онтологій owl
- •7.2.3. Основні терміни та поняття у Protégé-owl
- •Терміни та їх синоніми
- •7.2.4. Методика розроблення онтології засобами Protégé
- •Створення й експлуатація онтології
- •7.2.5. Створення онтології
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Література
- •Литвин Василь Володимирович технології менеджменту знань
- •V lp.Com.Ua, ел. Пошта: vmr@vlp.Com.Ua
2.1.3. “Піраміда” знань
Ієрархічність понятійної структури свідомості досліджуються в роботах багатьох психологів [18]. Поле знань можна стратифікувати, тобто розглядати на різних рівнях абстракції понять. У “піраміді знань” кожний наступний рівень слугує для сходження на новий ступінь узагальнення і поглиблення знань у предметній області. Отже, можлива наявність декількох рівнів понятійної структури Sk. Видається доцільним пов’язати це із глибиною професійного досвіду або з рівнем ієрархії на структурних щаблях організації. Зазвичай, стратегії прийняття рішень, тобто функціональні структури Sf, на різних рівнях істотно відрізнятимуться. Якщо спробувати дати математичну інтерпретацію рівнів піраміди знань U = (U1,U2,U3,…,UN), то найпрозорішим є поняття гомоморфізму – відображення деякої системи Е, що зберігає основні операції і основні відношення цієї системи. Нехай
деяка система з основними поняттями та основними відношеннями.
Гомоморфізмом системи Е в однотипну їй систему Е’ буде: , називається відображення
яке задовольняє такі дві умови:
Для всіх елементів з Е та всіх.
Відповідно до введених позначень рівнів піраміди суть гомоморфізму моделей (тобто понять і відношень) предметної області
де ;, – мета-поняття, або поняття вищого рівня абстракції; – мета-відношення; – мета-стратегії. Сходячи по ступенях піраміди, ми отримуємо систему гомоморфізмів, що відповідає результатам, отриманим в когнітивній психології про зменшення розмірності семантичного простору пам’яті зі збільшенням досвіду експертів.
2.2. Стратегії одержання знань
Під час формування поля знань ключовим питанням є сам процес отримання знань, коли відбувається перенесення компетентності експертів на інженерів зі знань. Для назви цього процесу в літературі з експертних систем (ЕС) набуло поширення кілька термінів: придбання, здобування, витягання, одержання, виявлення, формування знань. У англійській спеціальній літературі переважно використовуються два: acquisition (придбання) і elicitation (виявлення, витягання, встановлення).
Термін “придбання” трактують або дуже широко – тоді він об’єднує весь процес передавання знань від експерта до бази знань ЕС, або вже як спосіб автоматизованої побудови бази знань за допомогою діалогу експерта і спеціальної програми (структура поля знань заздалегідь закладають у програму). В обох випадках термін “придбання” не стосується самого таїнства екстрагування структури знань з потоку інформації про предметну область. Цей процес описують поняттям “видобування”.
Видобування знань (knowledge elicitation) – це процедура взаємодії експерта з джерелом знань, у результаті якої стають явними процес міркувань фахівців в ухваленні рішення і структура їхніх уявлень про предметну область.
Сьогодні більшість розробників ЕС відзначають, що процес видобування знань залишається “найвужчим” місцем у побудові промислових ЕС. До того ж їм доводиться практично самостійно розробляти методи витягання, зіштовхуючись із такими труднощами:
організаційні непогодженості;
невдалий метод витягання, що не збігається зі структурою знань у певній області;
неадекватна модель (мова) для подання знань.
Можна додати до цього:
невміння налагодити контакт з експертом;
термінологічний різнобій;
відсутність цілісної системи знань в результаті витягання тільки “фрагментів”;
спрощення “картини світу” експерта тощо.
Процес видобування – це тривала і трудомістка процедура, в якій інженерові зі знань, озброєному спеціальними знаннями з когнітивної психології, системного аналізу, математичної логіки тощо, необхідно відтворити модель предметної області, якою користуються експерти для прийняття рішення. Часто розроблювачі-початківці ЕС, бажаючи спростити цю процедуру, намагаються підмінити інженера зі знань самим експертом. З багатьох причин це небажано.
По-перше, велика частина знань експерта – це результат численних нашарувань ступенів досвіду. І часто, знаючи, що з А виводиться В, експерт не усвідомлює, що ланцюжок його міркувань був набагато довший, наприклад або.
По-друге, як стверджував ще Платон, мислення діалогічне. І тому діалог інженера зі знань і експерта – найприродніша форма вивчення лабіринтів пам’яті експерта, у яких зберігаються знання, частина яких має невербальний характер, тобто виражені не у формі слів, а, наприклад, у формі наочних образів. І саме в процесі пояснення інженерові зі знань експерт на ці розмиті асоціативні образи навішує чіткі словесні ярлики, тобто вербалізує знання.
По-третє, експертові важче створити модель предметної області внаслідок глибини й обсягу інформації, якою він володіє. Ще в ситуаційному керуванні було виявлено: об’єкти реального світу зв’язані більш ніж 200 типами відношень (тимчасові, просторові, причинно-наслідкові, типу” частина–ціле” тощо). Ці відношення і зв’язки предметної області утворять складну систему, з якої виділити “скелет” або головну структуру іноді доступніше аналітикові, що до того ж володіє системною методологією.
Термін “придбання” у цього залишений за автоматизованими системами прямого спілкування з експертом. Вони дійсно безпосередньо здобувають вже готові фрагменти знань відповідно до структур, закладених розроблювачами систем. Більшість цих інструментальних засобів спеціально орієнтовано на конкретні інтелектуальні системи із жорстко позначеною предметною областю й моделлю подання знань, тобто не є універсальними.
Придбання знань (knowledge acquisition) – процес наповнення бази знань експертом з використанням спеціалізованих програмних засобів.
Наприклад, система TEIRESIAS, що стала прародичкою всіх інструментаріїв для придбання знань, призначена для поповнення бази знань системи MYCIN або її дочірніх галузей, побудованих на “оболонці” EMYCIN в галузі медичної діагностики з використанням продукційної моделі подання знань. Три покоління та основні тенденції СПЗ будуть детально описані нижче.
Термін формування знань традиційно закріпився за надзвичайно перспективною галуззю інженерії знань, що активно розвивається і займається розробленням моделей, методів і алгоритмів навчання. Вона об’єднує індуктивні моделі формування знань і автоматичного породження гіпотез, наприклад, ДСМ-метод на основі навчальних вибирань, навчання за аналогією та іншими методами. Ці моделі дають змогу виявити причинно-наслідкові емпіричні залежності в базах даних з неповною інформацією, що містять структуровані числові й символьні об’єкти (часто в умовах неповноти інформації).
Формування знань (machine learning) – процес аналізу даних і виявлення прихованих закономірностей з використанням спеціального математичного апарату програмних засобів.
Традиційно до завдань формування знань або машинного навчання належать завдання прогнозування, ідентифікації (синтезу) функцій, розшифровування мов, індуктивного виведення й синтезу з додатковою інформацією. У широкому сенсі до навчання на прикладах можна зарахувати і методи навчання розпізнавання образів [9].
Індуктивне виведення правил із фактів застосоване також у системах AQ, AQUINAS, KSSI, INSTIL і деяких інших.
Найдослідженішими серед методів машинного навчання є, очевидно, методи розпізнавання образів, зокрема алгебраїчний підхід, в якому передбачається збагачення вихідних евристичних алгоритмів за допомогою алгебраїчних операцій і побудова сімейства алгоритмів, що гарантує одержання коректного алгоритму для виконання досліджуваного класу завдань, тобто алгоритму, що правильно класифікує кінцеву вибірку по всіх класах. Однак застосування методів формування знань не стало промисловою технологією розроблення баз знань.
Щоб ці методи стали елементами технології інтелектуальних систем, необхідно виконати низку завдань:
забезпечити механізм сполучення незалежно створених баз даних, що мають різні схеми, з базами знань інтелектуальних систем;
встановити відповідність між набором полів бази даних і безліччю елементів декларативного компонента бази знань;
виконати перетворення результату роботи алгоритму навчання у спосіб подання, підтримуваний програмними засобами інтелектуальної системи.
Крім перерахованих, існують також й інші стратегії одержання знань, наприклад, у разі навчання на прикладах (case-based reasoning), коли джерело знань – це множина прикладів предметної області. Навчання на основі прикладів (прецедентів) передбачає налаштування алгоритму розпізнавання на завдання за допомогою надання прикладів, класифікація яких відома.
Навчання на прикладах тісно пов’язане з машинним навчанням. Відмінність полягає в тому, що результат навчання в розглянутому тут випадку повинен бути інтерпретований у деякій моделі, в якій, можливо, вже містяться факти та закономірності предметної області, і перетворений у спосіб подання, що допускає використання результату навчання в базі знань, для моделювання міркувань, для роботи механізму пояснення тощо, тобто робить результат навчання елементом відповідної технології. Наприклад, у системі INDUCE породжується несуперечливий опис деякого класу об’єктів з великою кількістю прикладів і контрприкладів заданого класу. Як мова подання використовується мова багатозначної логіки першого порядку).
Зазначимо також появу двох нових “прапорців” у стані прихильників методів машинного навчання – це data mining і knowledge discovery. Обидва підходи ґрунтуються на аналізі даних і пошуку закономірностей.
Отже, можна виділити три основні стратегії проведення стадії одержання знань під час розроблення інтелектуальних систем (див. рис. 2.3).
1. З використанням ЕОМ за наявності відповідного програмного інструментарію, інакше – придбання знань.
2. З використанням програм навчання за наявності репрезентативної (тобто доволі представницької) вибірки прикладів прийняття рішень у предметній області та відповідних пакетів прикладних програм, інакше – формування знань.
3. Без використання обчислювальної техніки безпосереднім контактом інженера зі знань і джерела знань (експерт, спеціальна література або інші джерела), інакше – видобування знань.
Рис. 2.3. Стратегії одержання знань
У навчальному посібнику докладно розглядатимуться процеси видобування і придбання знань, тому що на сучасному етапі розроблення інтелектуальних систем ці стратегії є найефективнішими й найперспективнішими. Формування знань, що тяжіє більшою мірою до області machine learning, тобто індуктивного навчання, ґрунтуючись на добре дослідженому апараті розпізнавання образів і виявлення подібності об’єктів, виходить за межі цього підручника. Також поза цією книгою залишилися питання формування знань з даних (data mining, knowledge discovery) тощо.